新世纪互联网的告诉发展,大量信息的涌现。
人们更是不得不重视。
对信息的研究越深入,我们就越能了解到这个世界。
不管最初的目的是什么。
总之,在相当长的一段时间里涉及到文本摘要这方面的研究都相当受重视。
甚至在相当长的一段历史时期该领域的部分研究经费甚至直接是来自m國军费中的拨款。
涉及到文本摘要这个方向。
之所以当初当时进行文本摘要这方面的研究是旨在通过在文本摘要上实现技术突破从而能够更加高效地通过一些诸如新闻、报道各种公开的资料进行信息处理,同时进行文本摘要方面的研究也是为了能更好的实现对敌对势力的舆情分析。
至于是什么敌对势力,自然是昔年无比强大的北极熊。
伊芙·卡莉记得此前还在学生时代的时候就听闻西方关于文本摘要这方面的研究在冷/战初期就已经开始了。
最早进行这方面工作的是诸如斯坦福大学、麻省理工学院之类的这些学校。
不过当时这些学校背后的雇主是美國的大五楼角。
当输入内容不是文本的时候,也可以据此进行自然语言生成。
诚然如此的话,那么今后自然语言处理这方面会获得真正意义上的腾飞。
届时自然语言处理也会彻底摆脱现在一向圈地自萌的局面。猪熊的穿越:2014
其相比于传统的抽取式摘要只能借助于原有的文本内容抽取而言,能直接“无中生有”的进行摘要生成。
这样的一种算法在自然语言理解方面自然是做到了前所未有的高度。
而且这也启发着在自然语言生成方面有可能实现新的突破。
甚至可以说效率只是生成式文本摘要这项算法的外在表现而不是这一算法的真正内核。
通常意义上所说的自然语言处理(nlp)主要内容无非就是两部分。
一部分是nlu,另一部分是nlg。
涉及到具体领域,林灰所作的贡献在自然语言处理所做的贡献实在是同样很大。
相对于传统的抽取式文本摘要,生成式文本摘要的意义空前。
之所以说生成式文本摘要的意义空前,并不仅仅是因为这项技术在处理文本摘要上效率上更高。
都已经是2014年了,居然还有一个近乎于三十年前开始的计划在按部就班地向前推进。
做计划不难,难的是计划的执行力度。
就这份计划的执行力度,总之这在频繁两挡交替的美國几乎是难以想象的事情。
文本摘要的深度探索,让我们对信息的掌控更强。
就林灰在文本摘要上所作的贡献而言。
说林灰改变了世界也不为过。
后来随着间谍卫星等更高效获取情报的手段相继问世,m军方对这方面的研究的热情才逐渐被淡漠。
尽管如此,商业上对文本摘要的热情却几乎自始至终毫无动摇。
文本作为信息的重要载体,再怎么重视也不为过。
说起来这也是早期文本摘要编码的一个奇葩特征。
对中文这门使用人数相当多的语言基本没啥处理能力。
对俄文处理却几乎拥有和英文同等水平的高效性。
听起来很奇怪,但并不奇怪。
事实如此,现在人类互联网以及计算机方面各种各样的技术最初都和军方有着千丝万缕的联系。
甚至于不少技术几乎就是纯粹的军转民。
自然语言生成更是一项极为有价值的方向。
涉及到自然语言生成,更长远的未来可不仅仅是依靠文本生成文本。
理论上讲,当神经网络学习进展到一定地步的时候。
前者指的是自然语言理解,后者指的是自然语言生成。
林灰搞定的生成式文本摘要算法在自然语言理解和自然语言生成此二者上都有极为突出的意义。
涉及到生成式文本摘要这项全新的文本摘要算法。
一个转动的更快的轮子相比于一个同样能转但转的较慢的轮子相比有价值,但其实价值也不大。
如果仅仅看到生成式文本摘要在文本摘要效率方面的进步只能说是图样图森破。
事实上伊芙·卡莉觉得生成式文本摘要最不起眼的内容就是其在效率方面的提升。
不过仅仅是文本摘要这方面,伊芙·卡莉还不至于太悲观。
毕竟西方在文本摘要这方面一样是倾注了大量心血。
甚至于要远比华国在这方面开始的研究还早。

