注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

熊猫外交官 的博客

 
 
 

日志

 
 
 
 

信息资源小谈  

2012-11-22 19:51:36|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 这篇文章,主要是依据之前那五个学生的课堂作业为基础。但是可能过程当中会比较分散。所以就当一篇比较大的点评好了。因为细讲起来每一个都有各自的亮点。所以应该说还是算是蛮有新意的。且真是让我感觉,一代又比一代强啊。我跟这些老师差几十岁,我有新意很正常。但是我跟这些人才差4岁。我立即就感觉压力山大了。至于为啥我压力山大。还得一点点的给大家分析才有意思。

   我说了,第一个女孩写的题目是地方志研究。她以地方志资料为核心。做了大量调查。但是很细心的地方在于,她在查找过程当中所做的记录显示。即使是地方志,不仅其内涵从古到今在作者的动机上,记录内容的侧重上有明显的特征。跟地方志相关类似,但是属于另外一种信息源种类的地方年鉴在这个调查过程中是作为被排除研究范围的一种数据源。这种记录和后来用其跟地方志进行对比的时候,有显示出两者的差异来。这种文献分析判断,不是有心人,是做不到的。

   而她在文献分析的过程当中,对于地方志的内容排序,内容的数据编排也做了分析。比如肖老师在课上后来谈到。古地方志主要以天地山人事农常变八类内容,随着地方官的到期卸任为周期逐年进行编撰。侧重于这些事物的对应和变更性的记录。有些类似于地方行政档案。而现代地方志,则侧重于从古到今的地方特色介绍。注重展示某种现代意义上的整体性。且更注意每年的地方量化数据的编辑。这就说明不同信息在编撰,分类,查找的过程当中,都有着类似信息特性的隐性特征。虽然最后她也提到了年鉴有信息索引的问题。但是在我看来其实两者最大的差异在于作为不同分类的信息数据库对于信息编排的特性在我们整个查找过程当中是不能为我们普通人所注意到的。这也就是所谓的先天性的无知导致信息屏蔽问题类似百度这样的搜索引擎所提供的是一种简单地数据编排与索引服务。但是对于我们社会真正大量有价值的数据信息,其实首先是被埋没在用户对信息无知的基础上的。

  第二个女生做的汉典研究。在我看来,首先她选了一个好题目。所以只要把它分析好久有成果可做。这样的人不一定有第一个女生那样可以开发出来的天赋。但是把一个相对完整的目标物交给她分析,多半是没问题的。所以属于那种勤勤恳恳的员工类型。她对汉典的研究主要是让我关注两点。一个是汉典作为一种专业信息词典。可以说是做到了极致。无论是字,词,诗句,作者,还是其他跟文字语言相关的内容,解释,通义等等基本所有的内容都能找到。且其内部的词条衔接做的相当到位。我甚至有一种错觉。假如这东西不是一个网站。而是作为输入法的一个后台支持软件。或者是一个world的中文特有工具连接那将是一个什么样子。或许书面文章有没有错别字,懂多少成语诗词或许就不是什么大不了的问题了。

   第二点是它的讨论区。其实这个汉典假如把第一部做到的话。其实它的讨论区完全就变成了一种文字编译的后台编辑前台化的东西。也就是说,类似百度百科那样的东西,关键是仅仅提供了一个以词条为基础,的公开讨论留言板。但是,假如以汉典为基础,作为一种输入法的后台支持系统,然后有这样的关联逻辑讨论区,可以由用户直接进行对词条关联的编译讨论工作。那么这将是未来专业网络工具的又一个新趋势。最后的我们谈到的人立方,其实我们也会提到这一点。

    第三个女生。从其准备的工作量来说真的是大的可怕。可以说她以汉典和国学网两个作为基础。把所有的从一开始进入用户端的体验,界面使用,数据关联,内容侧重,数据丰富性等等唯独不仅注意到了。关键是还列了三大张表格!这表格还不是单纯的一横一纵。是横纵之间还有梯度与范围的差异性。我不知道这个女生是不是接到任务之后,别的课的活都不做了。还是她实在是太出色了怎么着。但是她做的整套PPT从数据,思维,到逻辑整理都做得无可挑剔。这要是仅仅凭2个月不到的课程就做到这个地步。真的,用天才来形容她的潜力都不过分。但是我不知道她过往的经历。但是真的基础工作做的实在是太好了。

   但所幸在于,虽然她逻辑上做的非常好。但是显然有点意气用事。啥意思呢?应该说她对客观事实的罗列横向的广度,纵向的深度都无可挑剔。但是对于具体实施的再定义方面,却并没有放开手脚。啥意思呢?应该说她有一些先天认知间接上的舒服。比如说,一定要找到两者之间的平衡。并对于国学网的界面进行了一个看似正确,但其实不是那么真实的评价。这个问题的关键,其实跟前两个女孩做的分析报告来比较就很容理解了。操作界面这个东西,其实是这样的。在我们点击进入一个网站之前,其实就有一个目的了。要么是查询数据,要么是常上去水,要么是作为学术讨论的聚集地。所以,数据库在如何被用户理解本身,就是一道门槛。所以,在一个网站里无论你做的项目索引分类有多好。对于国学而言。它对于用户是一个非常笼统的概念。一个脑袋里在想什么的人,会在完全背景迷雾的情况下进入国学网呢?对国学有兴趣的人。但是这样对一个大体上分类感兴趣的人,我们能说他是抱着对某种信息目的进行检索的吗?完全不是。绝大多数人仅仅是随意浏览。所以其实在这个网站内部搞得横向分类有多少。其实对于用户而言,第一个门槛就是无效的。

    因此,第二个女孩对于汉典进行的分析当中,也有这点让我感觉非常好,就是她对这个网站的所有功能都进行了操作式的反复体验。所以其总结出来的成果有着非常完整的直观逻辑性。这也是为啥我说她勤勤恳恳也能做出成果的原因。但要是她选了一个坏的课题。基本上大家看她的成果时,也就瞎了。所以这样的人要依赖好的课题才行。而第三个女孩从宏观层面对于不同网站的横纵向逻辑分析当中。宏观的整体性展示的非常好。横切面上的纵深做的相当出色。第二个女孩是认真,第三个女孩那真的可以成为一种天赋了。其实她所提供的那三张表给我感觉最重要的是,我一下子就了解了这个两个网站的内在特性与实力所在。但是如何驾驭,再构造方面。这个其实是需要学习跟修炼的。所以我也在想,真的是男女之间有特长。以及什么东西是人家一开始能做的。什么是需要修炼的。

   第四个女生我之前谈的也比较多。其实她对于自己稀有姓氏的研究,让我感觉最大的亮点在于,她在检索过程当中。发现了信息源的不同特性。这个特性不是特点。而是一种大的时代趋势。所为特点,是说我们说把一个人和另外一个人区隔开来。我们说这个人之所以是这个人,可以是因为什么什么什么。比如肖老师以前就一直强调,大英百科全书的权威性。纸板著作的著述的责任性。但是在这个案例当中。我们发现,其实百科全书的权威性,主要体现在对于编著者相对关注度较高的信息进行了大量精力纵深的研究编著。但是对于类似这种小姓氏的编著。在大部头的集合出版物当中,连一页纸的内容都不到。而在百度百科上,竟然其资料给出了三大段,三个源流的解释。这是所有纸板书籍都没有列出的。这说明其实权威著述从其编著的方式来说,也并非真的那么权威。

  这里其实就讲出了一个时代趋势。那就是网络时代的核心在于在信息广度上,不再是仅仅由几个权威性的编著者对所有信息进行集合。而是每个人在一个大的平台上,对自己相关感兴趣的信息进行编注。这个时代的特性在于,信息价值不仅体现在查阅者的需求,也体现在供给者的实际面目可以不通过几个权威的个体也能在大的时空区域内得以体现。这是纸版书籍所无法达到的一个极点。源数据的整理方式开源了。而信息再编辑的工作,将从信息集成转变成信息使用索引过程的再关联。

   最后一个女生做的是一个人立方的题目。人立方这个东西其实应该说是以统计学为基础。但是试图在海量数据当中靠人机互动得到情报分析关联的这么一个工程。虽然最初看起来像一个恶搞的玩具。但是一旦这个逻辑关联做到最后。其实就是可怕的人际索引工具了。其实,假如加入了类似各种行政部的记录资料的话。这个东西的统计关联性会更有逻辑。但是我认为这并不是这个东西搞出来的初衷。它的核心其实是思考如何对信息数据进行大量抓取以后的逻辑再建构。然后得到这个逻辑关系的回馈。说实话,这玩应太先进了。

    可惜的是,这个东西的逻辑,我们没法直接应用到对海量数据库的信息引用上。因为对词汇的引用记录反馈,对信息使用的引用记录反馈,绝对不会有以人的信息记录反馈那么频繁。但通过分析,基本上我们可以确定,这东西最后所总结出来的逻辑关联在未来的用处将是极大的。它现在是个试验场。但是哪个实验室能把实验开到每个人家里?人立方根本不愁数据反馈。这才是这玩应最可怕的地方。

     总之,从信息的数据特性,使用,界面逻辑关系,编著逻辑,次级逻辑关联基本上我们都做了分析。基本上这堂课的实际有价值的内容就是这些了。至于其他我没提到的。你们可以去自己看她们做的作业自己思考。但是有新意的亮点基本上我都提到了。包括她们的个人潜力指向。大概就这么多吧。

  评论这张
 
阅读(26)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017