也许你还记得影片《人工智能》里能和真人媲美的机器人,他们除了拥有与真人难以区分的完美外形,更拥有甚至能够超越人类的头脑。不知道你是否还记得一个场景,工程师问机器人“什么是爱”,她迅速回答“就是微张我的双眼,让我呼吸急促,体温略为上升……”电影中,智能机器人能迅速识别人类发出的指令,识别“机器眼睛”中捕捉的画面。但是,机器人没有人类所拥有的大脑,也没有上天馈赠的思维,它拥有的只是一个智能记忆芯片。
机器人怎么思考?它们的“大脑”就是我们使用的计算机,接收指令后,它“思考”的过程,就是根据所接受数据在数据库中搜索和分析的过程。现实中,科技的发展远没有达到《人工智能》的程度,但是,数据分析早已经在现实领域得到了广泛应用。搜索引擎就是一个例子,全球最大的中文搜索引擎——百度,已经开始朝着人工智能之梦迈进。
“百度一下”背后的故事
举个简单的实例,如果你百度一下“白加黑”,那么能够立刻得到包含“白加黑”这种药品所有信息的搜索结果,其中既有价格、成分、产地、生产商、相关新闻等直接关联的信息,也会有“感康”“板蓝根”等其他感冒药的关联信息,甚至还会出现“如何治疗感冒”“什么情况容易得感冒”“小儿感冒治疗”等大量信息。
对于用户而言,只是简单地输入关键词,查看结果,然而,背后包含的是“数据分析技术”中的“知识图谱数据分析”技术。什么是“知识图谱”?简单来说,可以理解成为计算机建立的知识体系,它把复杂的知识系统通过它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为数据库创立思维的路径。
所以,当搜索引擎的“知识图谱”越全面越细化,就相当于一个人的知识体系更加完善,搜索引擎也就越“聪明”,为用户提供的搜索结果就有可能越精确。但是,计算机并不会主动思考,如果仅仅有知识库而没有挖掘工具,再多的知识也只能石沉大海,于是,对“知识图谱”的“数据分析”(也就是我们所说的“算法”)就变得尤为重要,有了算法,才能把知识从库存中挖出来,算法越强大,挖掘出来的内容就越准确,越符合用户的搜索需求。