提高你的英语:重新发明字幕

1.简介结果
中国 - 塔蒂亚娜L.,这是可能的,我们将看到这部电影带字幕的结果? - 不,少年啄木鸟,我们训练你的听觉感受,让你看电影,没有他们!有字幕,你刚才读的文本,不听。结果 - 塔蒂亚娜L.,但没有字幕,我们有一半以上不明白结果! - 但是,这是你的问题结果2000年代初,在法国特殊学校与老师的对话,圣彼得堡
中国2 ...发生什么事了?结果 电视节目和电影 - 提高您的英语一个伟大的事情。你已经知道语法,拥有庞大的组字。保持与母语的自由谈话还早,实践检验和演习 - 很无聊。你开始看电影和电视节目。搜索结果 你看看你自己看吧。似乎一切都清楚了,可以理解,但随后开始的两个字符,从中你只知道借口之间快速对话。好吧,把潜艇。他们解决问题 - 你开始明白发生了什么。搜索结果 然而,看到有sabami一些影片中,人们往往注意两件事情。结果
  • 除了听力训练的您成为速读 B>外文潜艇的高手。现在你迅速了解了一句,只是看着她,但听觉感知略有进展。禁用潜艇,你再停下来了解什么是在屏幕上的一些场景发生的事情。学校的老师塔蒂亚娜L.是正确的,不许我们看法国电影sabami - “少年啄木鸟”,真理不是在听力和语言思维结果
  • 进展有些电影完全的地区依然存在。令人费解由于这样的事实,它们包含难字。 “我不能危害我公司成功»?什么对不起? 危害? B>。好吧,谷歌,我把电影的停顿,你能告诉我这是什么意思。结果 有家伙,提供观看字幕电影两种语言 - 英语和俄语。是什么让你迅速拥有在快速阅读潜艇绝对的冠军,在两种语言,但是贡献甚微听觉感知和语言思维的发展。结果 ul>结果  没有潜艇目前尚不清楚什么,并与听觉感知和sabami阻碍进步......仍然是不明确的。搜索结果3。现在怎么办?结果 搜索结果 在由“南方公园”这张截图看到7个字。其中6所熟悉的几乎所有学生的英语。他们可能是认识和了解,即使他们是快速和重点发言。仍然存在一个字,它(具有高可能性)是一个问题。这个词的疲惫 B> - 累了,疲倦的搜索结果
  • 这句话不是那么常见。有很好的机会,你不通过耳朵识别它。
这将是直接在屏幕上显示翻译。否则,要么必须分心,并借助词典进行翻译,或者干脆将比分并没有进一步看。 ul>结果  这个词的其他部分可以抛出。他们知道几乎所有的东西,并没有需要显示在屏幕上。如果我们将这个逻辑到现场的其余部分,我们得到萨巴,其中只有难词,而我们其余的倾听和理解。搜索结果 事实证明,这种想法并不新鲜。快速gugling表明,至少有一些博客已经写有相同的想法的文章,但提供了手动字幕做了改编。而我们,怪才,我们会做软件潜艇的自动适应!搜索结果4。建设自行车结果 将问题归结为寻找文本难词这就需要翻译。搜索结果 其基本思想是,你可以分析ooooochen许多文本在英语上使用的话计算统计和了解,有些话是用少得多的频率比其他人。这几句,属于“复合词”的理念下 - 他们是罕见的,所以你不知道翻译和写作。搜索结果 我已经做这一切为下班后的业余爱好(顺便说一下,这里是关于这一切是如何开始的文章)。所有这一切都导致了竹忍者项目,这使我们能够分析本英语书,在其中发现难词,将转移并收集书放回。字幕 - 这也是文字,所以我就买了那里的事态发展,并将其应用到字幕搜索结果。 我们打​​开潜艇,它们分割成块,然后为单个单词并开始分析。对于每一个字,我们需要解决两类问题 - 很简单的字是否学习英语或复杂 - 通过返回的1或0的输出的算法跳字。他的决定分类使得从分析获得的统计数据的基础上〜40 GB从各种来源的文本数据(通常是值得的,在非常不同的来源实际上是收集数据:肠道聊天记录,新闻,歌词,但我太懒惰,在主要课本使用但后来更多)。搜索结果 再有就是与数据库的麻烦一定的量,编写代码,并把看起来像这样的结果潜艇 搜索结果5。我们走在自行车上内置搜索 我通过3-4打潜艇,由分析仪发出的度量的估计值的程序开车。我试着看所发生的电影。他拿给朋友,熟人和游客。搜索结果 为了评估结果,我用的机器学习任务两种经典指标:结果 加 B>(精度) - 字 完整性<正确分类的能力/(召回) - 找到所有的字需要翻译 ul>是否发现该指标的值往往从电影拍摄跳跃的能力。在一些薄膜,完整性和准确性显示85%所需的-90%,但在另 - 中的55%的区域。挖掘到这个问题,我找到了原因 - 进行统计分析我收集的近300年的艺术书籍资料的很大一部分,和一些在他们的话是比较常见的比在现代英语中找到。例如,字刺刀 B>(卡口),在那些日子里,更常见比现在,但我们的分级这个词说并非如此罕见的。搜索结果 虽然科林,我的朋友来自英国,长笑着说,表达“我的肉刺刀»(牛肉刺刀)是军队中很常见,但该事件将不被考虑。搜索结果 我决定要恢复到旧版本的分类,这是我几个月前使用。它始建早在只有500家大书夏天,但样品中的书是越来越多样化,“哈利·波特”,“宋冰和火,”程序员的技术文档,在心理学,医学和更多的书。限定词数据的较小但更多样化量证明是幅度比构建只对英语文献分类更好的顺序。文字识别算法已远远不常见的错误。搜索结果 这个结果总体上与目标一致,但该算法仍然会产生萨巴适用于具有在使用英语的经验相当丰富的人。这是需要有耳朵和几千字的基本词汇有形语音识别一定的技巧。在这种情况下,潜艇会站在非常有利提高英语。搜索结果 他的所有实验我旨在支持并固定到他的业余爱好网站,并加入到小潜艇库为那些谁想要测试的一块,是不是当场。搜索结果6。结尾结果 打开预览系列在学习的过程,而不是生硬的屏幕阅读似乎是值得的任务。和算法的改进允许有更多夜晚的益处。搜索结果 谢谢大家!好电影和学习英语的成功。搜索结果 来源:geektimes.ru/post/271208/