爱看文学网

手机浏览器扫描二维码访问

第67章 你们能比我更懂机器翻译5k(第2页)

林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?

我同时会俄语、德语、英语和汉语。”

多语言大师的身份,给林燃的理论增添了几分可信度。

在这个时代,科学家们会几门语言并不奇怪。

当然一些敏感部门会提高对你的怀疑。

以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。

“另外翻译过程,应该是模块化设计,而不是简单的映射关系。

它应该分成预处理、翻译、后处理三部分。

预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。

这样来降低单次计算的复杂度,提高规则的复用率!”

林燃的话给了在座研究团队的成员们非常多的灵感。

就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。

大家都有点迫不及待去尝试了。

所有研究人员都疯狂在笔记本上记录下林燃所说的。

虽然不确定教授的方法是否管用,但有路总比之前没有好。

再者,如果你不好好记下来,到时候被开除只是教授一句话的事。

“好了刚才我们讲了一些简单的内容,现在才是最难的。

因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。

我把它叫做基于频率的词对齐。

这也是我们引入统计模型的核。

我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。

俄语句子Мыговоримомире

英语翻译:“Wespeakaboutpeace

对齐结果:“мы”

对应“we”

“говорим”

对应“speak”

“о”

对应“about”

“мире”

对应“peace”

然后我们需要对这种对齐的频率进行统计。

统计每个俄语词或短语在英语中的对应翻译出现的频率。

例如,在语料中,“говорим”

在80%的句子中翻译为“speak”

,20%翻译为“talk”

这样对于我们就可以构建概率表了。

将这些概率整理成表格,供机器进行查询。

重燃青葱时代  重生的我只想追小姨子  怪她太乖  换亲后!带火婆家!  怪猎:这条火龙有特性  娶了棺中女帝,我在都市修仙  团宠小福星,扛着粮仓去逃荒  农门悍媳有空间,嫁猎户被宠不停  请天下赴死  亡国公主娇又软,糙汉可汗夜夜宠  海贼:从捡到红发断臂开始  第四天灾:人在高武,游戏成神  三年婚姻守空房,我独美你发疯  女儿喜欢后爸,我成全他们一家三口  四合院:开局何大清要跑路  奥特曼:开门啊,是我,老人迦!  平步亲芸  蓄谋已久,强扭的白月光他又酸又涩  反贼之路:开局抢了和亲公主!  出宫第四年,清冷摄政王夜夜求复合  

热门小说推荐
末世之重见光明

末世之重见光明

各种元素乱入,如不懂,请看评论区评论!为了娶媳妇不能割,于是本人不能进宫,本书完本了,哈哈!...

鬼手狂医

鬼手狂医

身为鬼道传人,小胖洞悉天衍之术,可用鬼杀人,亦可治病救人,但这些对于小胖来说,都不足道哉!Tags鬼手狂医佐墨鬼手狂医txt全集下载鬼手狂医无弹窗鬼手狂医最新章节鬼手狂医txt全文下载鬼手狂医全文阅读...

清穿皇妃要娇养

清穿皇妃要娇养

穿来清朝,温馨基本上就绝望了!在这个清穿多如狗,主子遍地走,前有李氏恶虎拦路,后有年氏步步紧逼,还有福晋四处放火,想要安安逸逸的过日子,简直是难如登天。论想要杀出重围,安稳度日,怎么破...

顾少轻点宠

顾少轻点宠

二十岁的霍念念,突然得知自己罹患脑癌,只想死前放纵一把的她,误打误撞的和帝国集团总裁顾廷深过了夜,从此,两人纠缠不断,而霍念念的人生也开始彻底反转...

乡野神医俏婆娘

乡野神医俏婆娘

作者鸭霸的经典小说乡野神医俏婆娘最新章节全文阅读服务本站更新及时无弹窗广告小说落魄小伙摇身一变成乡野小神医,治治病,喝喝茶,闲聊时来带领乡村致富,本是咸鱼医生。。。。...

情尘风月

情尘风月

从景仲言的秘书,到成为她的妻子,整个过程中,乔蕊都扮演着被动者的角色。景仲言说他需要一个妻子,她最合适,乔蕊觉得自己需要保住这份工作,就忍辱负重的同意了。可说好的,婚后分房,各安其身呢?为什么这男人却不守信用。不过还好,当那个曾在他生命中留下最最浓艳色彩的女人回归时,乔蕊觉得自己终于可以全身而退了。只是...

每日热搜小说推荐