购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言

大约10年前,我在攻读硕士学位时第一次接触到自然语言处理这个领域,并立刻被它深深地吸引住了。计算机能够帮助我们理解大量已有的文本文档,这样的前景听起来不可思议。我仍然记得,当看到我的第一个NLP程序从几个文本文档中提取出大致正确且有用的信息时,我有多么兴奋。

大约在同一时间,在工作中,我需要为一个客户提供咨询服务,他们正在开发新的开源搜索架构。我的一位同事是该领域的专家,但他当时正忙于另一个项目,于是他给了我一本 Lucene in Action 。我研究了这本书几周之后,就被派去做咨询工作了。在我为那个基于Lucene和Solr的项目工作几年后,这个新的搜索引擎上线了(据我所知,它目前仍在使用中)。搜索引擎算法经常因为某个查询或者某个索引文本片段而需要反复调整,但我们让它工作了。我可以看到用户的查询,也可以看到检索的数据,但是,仅仅由于拼写上的细微差别或遗漏某个单词,就可能导致密切相关的信息无法出现在搜索结果中。为了提供尽可能好的用户体验,产品经理常常要求我进行许多人工干预。因此,虽然我对自己的工作感到非常自豪,但我也一直在思考如何尽量减少人工干预。

在此之后,我很偶然地发现自己涉足了机器学习领域,这要感谢吴恩达(Andrew Ng)的第一门机器学习在线课程(它是Coursera MOOC系列课程的起源)。我对课堂上展示的神经网络背后的概念如此着迷,以至于决定尝试用Java实现一个小型的神经网络库,只是为了好玩儿。为此我开始寻找其他在线课程,比如Andrej Karpathy关于视觉识别的卷积神经网络的课程,以及Richard Socher关于自然语言处理的深度神经网络的课程。从那以后,我一直专注于搜索引擎、自然语言处理和深度学习,且主要是在开源领域。

几年前,Manning出版社找到我,希望我为一本关于自然语言处理的书写评论。我撰写了评论,并在该评论的最后提到自己有兴趣写一本关于搜索引擎和神经网络的书。当Manning出版社再次找到我,表示对此有兴趣时,我有点惊讶,并且自问:“我真的想就此写本书吗?”我意识到,是的,我很感兴趣。

尽管深度学习已经给计算机视觉和自然语言处理带来了革命性的变化,但它在搜索领域的应用空间仍然有待探索。我相信目前我们还不能依赖深度学习来自动设置和调优搜索引擎,但是它可以让搜索引擎用户的体验更加流畅。有了深度学习,我们就可以在搜索引擎中做一些其他现有技术做不到的事情,或者强化搜索引擎中现有技术的功能。通过深度神经网络提高搜索引擎效率的旅程刚刚开始,祝你旅途愉快。 lfNDo2P20GriDAZWb3tzNZf+ateirqehaEiQRI65Myd8AMR2yR8nekkps4ijlm2h

点击中间区域
呼出菜单
上一章
目录
下一章
×