第30章 分类原则
潘宜心更是兴趣大增:“没问题,就算是晓语也甭想从这嘴里抠出一个字来。”
秦晓语啐道:“你这卖友求荣的家伙。”
“这是原则!”潘宜心少有地反驳道。
朱天赐暗自点头,看来潘家的优秀品质一脉相承,他说道:“这样,下周你们再来,我把资料打印出来给你。”
潘宜心痛快地道;“没问题。”
秦晓语笑道:“哥,我保证把她安全带来。”
林月彤也鼓起勇气:“我也来。”
她也泛起了心思,这位好朋友的哥哥可不是一般人,电视上那些大少跟他比起来,简单都是一群土鸡,将来如果在他的公司谋个职业,比到其他的小公司应聘肯定要好上十倍百倍,有好朋友这么得天独厚的关系,不能轻易放过。
朱天赐看了她一眼,笑道:“这个课题是个大工程,你如果能保守秘密,也可以参与进来,跟宜心商量着一起做,两个人总比一个人更容易。”
分类技术虽然是核心机密,但毕竟刚刚起步,妹妹的朋友总比别人更值得信任,可以给个机会考查一下。
林月彤激动地道:“我保证不对外泄露一个字。”
她想不到机会这么轻易就降临了。
秦晓语道:“不行,我也凑个热闹。”
“算了,动脑子的事情还是让她俩来。”朱天赐对妹妹这个大嘴巴不太放心,“哥将来给你一家公司,让你随便折腾。”
潘宜心和林月彤羡慕地望着好友。
秦晓语撅嘴道:“我才不折腾呢,将来我要当一个好医生,相夫教子,平平安安快快乐乐地过一辈子,就知足了。”
潘宜心好笑地道:“还相夫教子,是不是看着哥哥嫂子这么恩爱,也想找个男朋友了。”
因为涉及到业务,江素心一直没有播话,闻言道:“晓语的想法很好啊,我们女人,不用都当女强人。”
见她这么说,潘宜心和林月彤知趣地没有反驳。
秦晓语说道:“好,反正我对计算机和人工智能没什么兴趣,就让她俩搞,我来当个监工总成了?”
她心里清楚,这个哥哥之所以想用这两个好友,当然是因为她的关系,潘宜心或许还有老爸的因素在,林月彤纯粹是因为她,她就算不参与,这条线的绳头也攥在她手里,她要把这种关系维护好,还要为好友作保。
饭后,朱天赐与江素心漫步在校园。
江素心知道了心上人之所以总是逃课,是在搞人工智能的研究,心里就有些歉疚,他是因为她才报的医学院,原本应该是学计算机方面的专业的。
但事已至此,后悔也没用,以后给他更多的自由空间就是。
朱天赐倒无所谓,他之所以想研发人工智能,只是不想浪费了变身的能力,并不一定要有成果,就算最后无果而终也无所谓。
之后的一周,朱天赐将他之前对分类的理解进行了归纳。
在医学上,记忆分为主动记忆和被动记忆。
被动记忆很少形成分子层面的记忆蛋白,时间长了就会自然遗忘,这部分信息一般不加关注,信号刺激较小,一般存在临时记忆区,这部分记忆一般也不用分类。
而主动记忆不只对其中某些信息信号附加关注,而且大部分有预期,也就是事先就准备好了分类通道,比如,看书时肯定会把其中的文字内容先与语言中枢连接,以便进行理解,而不会把文字当成一般图像来处理,想辨识一个人时,肯定只会放在“人”的分类区域,而不会放在其他的动物和植物类别,更深入一点,“女人”,“年青的女人”,会与这些更细的分类区域直接连接。
而这些分类通道有很大部分是大脑固有的,因此进行分类要遵循这些大脑的固有分类习惯和基本的原则。
比如自然原则,人将看到的常见植物分成树木和花草,是根据它们的自然特点,也就是特征,特征是具体事物的分类关键。
但自然原则只起一个参考,对人的认识来说,不一定要按植物学的分类,分成这个纲,那个目,完全不必要。
这就有一个认识原则,将所有的事物只分成两类,认识的和不认识的,认识的又分为常见的和不常见的,常见的树木也不用分得太细,直接分成槐树、杨树、柳树、松树等等即可,不用分什么纲目。
人对于同类的人是最敏感的,将人分类,可以分成男人和女人,也可以分成老人、青年和小孩,但除此之外,还可以分成熟人和生人,人在看到另外一个人,进行识别时,除了判断他是男人女人,年龄阶段之外,最优先考虑的这是不是自己的熟识,尤其是不是自己的亲友,经常见面的亲人、朋友和同事,在人的认识中占有相当重要的位置。
再就是简化原则,人的认识本来就很简单直观,分类的时候不用将事物的联系过于紧密,比如,所有的桥都是桥,所有的道路都是路,不管是高速公路还是羊肠小道,至于桥梁和道路属于交通,那是另外的事,分类的时候,直接就分成桥和路各自的一类,与交通并没有从属关系。
人的大脑能存贮的信息量是有限的,不可能将看到的信息全部存贮起来,只能尽可能地简化,简化原则对分类来说也非常重要,甚至可以说是分类的关键。
还有关已原则,大火、洪水、雷电、毒蛇、持刀的凶徒都是危险的,苹果、蛋糕、烤鸡等都是美味的,苍蝇、蟑螂、粪便等都是让人讨厌的,这些与人的切身利益有关系的事物在分类时,要考虑关已原则。
空间原则,一个人会有地域的移动,比如从一个乡村考上大学,在另外一个城市生活,自然而然要把两地的建筑和地形分成两个地域,在见到一个有些熟悉的人时,首先要考虑是老家的熟人,还是上班后的相识。
时间原则,人的记忆蛋白不会主动删除或改写,新的记忆不会占用已经写入记忆的细胞,而是会优先选择空置的记忆细胞,这样旧记忆和新记忆就会形成一个自然的时间序列,人在回忆的时候大概能估计这些记忆的时间点。
另外,还有一些其他的原则,比如特征原则,共同认可原则,学习原则等。
分类时,除了原则之外,还要有一些处理方法。
比如一个事情可能从属很多的类别,如何将它分类?是将一个人分成男人和女人,朋友还是路人,这就有个优先的问题,如果是同学,肯定要先分到同学一类,然后再打上一些标签,男人,公务员,爱吹牛,这些都是标签,而不是分类。
但标签在检索时,也属于分类,这就是神经网络的复杂性,不过,对于人工智能这不是问题,在相应的分类存贮区留下指针地址即可,计算中心可以根据指针去寻址,不必像神经那样单独形成一条通道。
除了标签方法,还有拆分、合并、转移、忽略等方法。
分类对于人工智能之所以如此重要,是因为人工智能要模仿人脑的功能,而人的记忆是分区域的,人在记忆事物的时候,首先要根据事情的特征进行分类,并根据类别存贮到同一类的区域,在对事物进行识别时,也不会穷尽每个记忆,而是根据特征的分类,直接该类别的记忆区域,分类越细,得就越快,识别的就越准确。
人在记忆和识别一个人时,不会把人与狗的记忆混在一起。
人在记忆文字的时候,会在人的脑域形成一个单独的区域,称作视觉语言中枢,它是一个非常复杂的神经网络,与其他的记忆区域形成繁琐的连接通道,它对文字信息进行加工,并通过这些连接通道在意识中枢形成可以理解的信息,视觉语言中枢不是生来就有相应的文字信息加工功能的,需要长年的大量的反复的经验,来生成更多的树突通道,使复杂的文字通过语言中枢与其他记忆区域进行连接,连接越多越复杂,理解力就越强,细致而正确的分类对于人工智能的文字阅读理解能力至关重要。
知识在人的智慧中占居了越来越重要的地位,文字本身的分类也是一个非常复杂而且关键的工作,但文字的分类可以参考其他事物的分类来进行,因为文字本身只是一种符号,文字和文字的组合代表的还是具体事物。
人的汉字语言中枢与英文语言中枢并不在同一个位置,这就是在学习外语的时候,要形成相应的语感,对应的就是处理语言的记忆区域。
朱天赐将这些与分类有关的资料归纳起来,制定了几条分类标准,打印了出来,在约好的周六,分别给了潘宜心和林月彤一份。
对具体的事物进行分类是很繁琐的,他将这些事情交给别人,就可以将时间腾出来,专门进行其他的编程,尤其是图像预处理,这也是非常重要的一部分,而且只能他自己来完成的。
两个女生大略看了一下资料,像得到宝贝似的,小心里放进自己的小包包里。
她们知道自己进入了一个非常专业的领域。
为了提高她们的工作效率,朱天赐给她们在两校中间长租了一间公寓,并且每人每月五千元的交通饮食补贴。
二女兴奋不已,还没正式上班,就先拿工资了,她们觉得自己已经成了公司的一员。