注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

熊猫外交官 的博客

 
 
 

日志

 
 
 
 

百度-从信息搜索到信息调用与信息统计  

2010-08-02 18:21:41|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

    前面我们提到了有关组织数据库的建立,作用,以及互动的意义。接下来,我们要在这篇文章当中,讨论录入,搜索,调用,以及整理的内涵和前景。假如说,我们想知道某一个城市的街道,亦或者上世纪八十年代某个歌星名字所代表的含义。相信,就今天的搜索引擎和wiki百科的联合搜索平台都可以为我们达成这样一个目标。虽然就某些自由录入而言,有着可能的局限性,但是依旧已经实现了我们上个世纪不可企及的各种信息与技术革新。有关未来组织数据库和各种不同个人及团体的用户调用。除了像现在这样对各种平台的信息字符搜索,开放式自由上载数据库和组织之间的数据库网群以外。实际上,在下个阶段的发展中,将会在技术而非行政管束上进行进一步的格局规范和功能创新。

    我们所关注的大概是这样两种网络体系的规范和建设。一,以个人为单位的开放式信息数据库的发展。二,组织性的集团网络在横纵向的发展延伸。首先,我们要明确一个基本概念,没有对这个功能的清晰认识,实际上我们就很难完全理解数据库的价值,以及其带来的作用。即数据库的存在不仅是为了作为图书馆一样记录事件的记忆体,实际上,数据库在很大程度上是类似计算机硬盘的信息收集载体。通过数据库的建立,其基本作用就是有效地录入一个组织当中所用成员和事件发生的情况与记录。这包括每天每个成员规范的电子工作情况报告,和作为组织的各种合同,项目的可检查的进度数据录入。不仅是组织成员和公司,实际上大多数社会信息也完全可以通过建立各种规范性的数据库,来达到这种对已发生事件的时间上的纵向记录。其目的,就是不仅管理者,或者个体成员可以不再通过部门间或成员间的电话沟通,而是通过数据库的信息报表了解各环节实际进展情况,以及必要了解的所发生事情的状态。数据库的建立不仅可以使得整个企业,社会,甚至个人的行为反应有可就查的纵向纪律隧道,以便及时检索任何问题的发生,原因,范围,性质等情况,而且,通过独立于当事人之外的数据库建设,也大大减少的各部门信息沟通的成本与时间。当然,我在很久以前,也提到过,真是因为这样一种新型信息沟通模式的建立,使得一些站在以信息枢纽为本职权力的相关管理者,必然被迫转型从事更加务实的工作当中去。进而,达到我们所计划的组织扁平化的状态。即,数据库的建立,其首要目的就是在一个组织内部,首先通过信息改革,达到这样一个组织结构的轻量化。中层管理者,和信息掌握者势必要将数据掌握这一权利,下分到数据库和数据公开的环境里。在未来,不再有因为信息问题而存在任何权力运作问题。

     那么,接下来问题就来了,信息录入者的录入信息,如何使得其信息质量足够得以保证,并确保不会因为利益或者权利而导致录入者虚报信息。作为数据库信息的调用者,如何确保,每一个调用者都能得到其想要了解的内容,同时不会造成组织重要信息外泄。这两个问题,一进一出,在我们上面所提到的两种网络数据库平台当中,又会遇到哪些不同的问题,相应如何解决,则将是接下来,我们即将探讨和大家需要思考的问题。而我尽在这里抛砖引玉,具体问题,我相信做数据库组模和统计学的高手,一定有能力制造出相应的工具。我们仅在这里讨论一下,一些情况的具体功能运作的意义,和必要注意和保障的底线是哪些。

    我们刚才提到,第一种为社会性的全公开或半公开无权力性质的信息数据库以及平台的对联和发展。这种数据库的代表,主要以wiki,百度地图,博客,社区等全上载和公众资源的数据库。照现在的情况而言,这类数据库在录入方面面临两个问题,首先录入内容和行为的是沟通性的,因此没有目标性的规范与可检验的内容流程可言。其次上载的内容差异性较大,内容复杂繁复,不容易作为可科学规范性的行政或信息价值提升的应用。在信息使用方面,有很多具有商业组织或政治团体挂靠在这些公共资源数据库和平台上。导致了一些信息的滥用和散发,造成不良后果。一些可造成人身危害性的信息公开也造成,一些信息危害和录入方面的信息虚报。所导致的整个网络浮躁。

    面度这些问题,我们首要的工作就是规范和定义一些公共网络数据资源的性质,功能与责任。明确其行为目的的底线保障这些公共数据库不会因私利,而导致一些侵犯信息录入者的的利益和安全。虽然公共数据平台,一般都没有对个体行为的目标要求。但是整个数据库的存在却是因为一些原因而吸引信息录入者和信息使用者的加入的。因此,假如我们想将各种不同种类,不同属性的公共资源数据库制定可检验的流程,进而达到数据库所载价值的提升和可搜索性。除了基本的中华人民共和国网络保障条例里面那些看似很严实际毫无操作性的条款所画的界限以外,通过数据库所提供的服务,设计和要求其对内容录入流程,模式和限制则是必要的。而第二点,则是我们今天所提的主题,搜索引擎的发展方向。在公共资源方面,仅仅靠字廓搜索制定信息目录在未来网络发展的大环境下是不够的。不仅是对组织用户而言,实际上哪怕是个体用户,在信息搜索引擎上,也逐渐会出现这样的要求。那就是信息统计和信息调用。多一点来讲,个体用户对信息数据将不会局限于搜索相关信息资源,或者相信那些在历史上没甚持久性的权威评级机构和信息提供者。搜索引擎对搜索到的信息根据用户需要的用途制定各种模块类型,将信息进行统计分类和报表呈现。将是未来信息搜索引擎对大众进一步对数据挖深的利器。而在信息使用者方面,则我们必须根据数据库类型和录入信息的类别,对个人数据制定协议和保护类别的法律制定。并通过逐步完善的类似的统计引擎将这些要求对公共数据库进行检索和检查,并发现问题。通过这些可以抓得到,可规范的方式来整顿公共数据库,则我们就可以将现在的各种有不良企图和伤害任何成员利益的团体与个人的行为孽杀于行动之前。同时也可以通过这样的模块化信息建设在很大程度上,防止现在的一些数据库管理员和信息掌握者造成新的权利滥用,腐败。将个人的行为,责任与权力完全圈化出来的时候,网络浮躁的氛围将彻底改变。而起点就是信息改革。

   而在第二种网络组织功能性的数据库矩阵。则面对这些问题,有着不同的难处。在录入方面,可能信息规范化由于组织目标性的明确,很容易在信息录入上根据不同职位工种设计相应的信息录入要求规范。再次特别强调,信息录入的格式主要是便于数据库搜索引擎的统计需要,而对于信息价值而言,则主要看对录入者详细的信息价值要求。重点在于使用。第二种数据库网络的特点在于,各种数据库是根据所属组织所建立起来的,即录入者首先是数据库的建立者。然而,在使用上,不同数据库不仅要根据情况与其他数据库在一定程度上提供数据使用权限,同时还要做到数据同步共享的横纵向连接。而对于其中一个组织内部而言,数据库的使用,权限,保存,则要比其建立的价值和意义本身要具有技术难度。比如,假如在美国汽车制造业内部有这样一个信息系统的话,那么很多问题则将在第一时间通过数据反映到决策者的控制面板上以待与专家和各方负责人分析和解决,然而如何确保,这样一个数据库网络的通畅和真正的可以像种子一样植入和规范到任何一个组织的上游供应商或者下游客户的生活框架内,要比技术性的连接,更加需要组织创新和新型产业协调的运作。当然,我敢保证,在未来,集团化作战对信息的要求绝对不是类似投标的信息吐露和技术失窃那些小问题上做文章。信息在未来就是一个产业存在的基本神经中枢。而其他人只是靠这一系统网络比谁做的更精准,更快,更便于反应。比的不是零和,而是相对战力的绝对差距。

     而至于,我们文章的题目,说简单一点,这就是一场信息神经进化的一个必要部分。在信息数据搜集的基础上,做到数据统计,数据挖掘和数据调用。这三者将是这个系统真正建立起来的必要器官与机能。才会使整个数据系统具有自主的反馈机制。社会信息的反馈,单靠道德,要求与提议得到的就如同我们今天看到的愤青,砖家叫兽的浮夸熔炉。将这一信息反射功能设计和融合到信息网络存在机制当中才是使其具有我们所预期功效的开始。

  评论这张
 
阅读(19)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017