CS224N(1.31)Translation, Seq2Seq, Attention

今天介绍另一个NLP任务——机器翻译,以及神经网络机器翻译模型seq2seq和一个改进技巧attention。

机器翻译最早可追溯至1950s,由于冷战的需要,美国开始研制由俄语到英语的翻译机器。当时的机器翻译很简单,就是自动从词典中把对应的词逐个翻译出来。

后来在1990s~2010s,统计机器翻译(Statistical Machine Translation, SMT)大行其道。假设源语言是法语$x$,目标语言是英语$y$,机器翻译的目标就是寻找$y$,使得$P(y|x)$最大,也就是下图的公式。进一步,通过贝叶斯公式可拆分成两个概率的乘积:其中$P(y)$就是之前介绍过的语言模型,最简单的可以用n-gram的方法;$P(x|y)$是由目标语言到源语言的翻译模型。为什么要把$P(y|x)$的求解变成$P(x|y)*P(y)$?逐个击破的意思,$P(x|y)$专注于翻译模型,翻译好局部的短语或者单词;而$P(y)$就是之前学习的语言模型,用来学习整个句子$y$的概率,专注于翻译出来的句子从整体上看起来更加通顺、符合语法与逻辑。所以问题就转化为怎样求解$P(x|y)$。

Continue reading

CS224N(1.29)Vanishing Gradients, Fancy RNNs

梯度消失

今天介绍RNN的梯度消失问题以及为了解决这个问题引出的RNN变种,如LSTM何GRU。

上一篇博客中,通过公式推导,我们已经解释了RNN为什么容易产生梯度消失或梯度爆炸的问题,核心问题就是RNN在不同时间步使用共享参数$W$,导致$t+n$时刻的损失对$t$时刻的参数的偏导数存在$W$的指数形式,一旦$W$很小或很大就会导致梯度消失或梯度爆炸的问题。下图形象的显示了梯度消失的问题,即梯度不断反传,梯度不断变小(箭头不断变小)。

Continue reading

CS224N(1.24)Language Models and RNNs

今天要介绍一个新的NLP任务——语言模型(Language Modeling, LM),以及用来训练语言模型的一类新的神经网络——循环神经网络(Recurrent Neural Networks, RNNs)。

语言模型就是预测一个句子中下一个词的概率分布。如下图所示,假设给定一个句子前缀是the students opened their,语言模型预测这个句子片段下一个词是books、laptops、exams、minds或者其他任意一个词的概率。形式化表示就是计算概率

$$\begin{eqnarray}P(x^{(t+1)}|x^{(t)},…,x^{(1)})\tag{1}\end{eqnarray}$$

$x^{(t+1)}$表示第$t+1$个位置(时刻)的词是$x$,$x$可以是词典$V$中的任意一个词。

Continue reading

CS224N(1.22)Dependency Parsing

Dependency Parsing是指对句子进行语法分析并画出句子成分的依赖关系,比如对于句子“She saw the video lecture”,首先可以分析出主语、谓语、宾语等句子成分;其次可以分析出依赖关系,比如saw依赖于She等。这就是句法分析。完成句法分析的算法被称为句法分析器parser,一个parser的性能可以用UAS和LAS来衡量,UAS就是parse出来的依赖关系对比正确依赖关系的正确率,LAS就是句子成分分析的正确率。

Continue reading

CS224N(1.15 & 1.17)Backpropagation

这篇博客把1.15和1.17两次课内容合并到一起,因为两次课的内容都是BP及公式推导,和之前的Neural Networks and Deep Learning(二)BP网络内容基本相同,这里不再赘述。下面主要列一些需要注意的知识点。

使用神经网络进行表示学习,不用输入的x直接预测输出,而是加一个中间层(图中橙色神经元),让中间层对输入层做一定的变换,然后中间层负责预测输出是什么。那么中间层能学到输入层的特征,相当于表示学习,自动学习特征。对于word2vec,中间层就是词向量。

Continue reading

《三国演义》人物命运走向

董卓

东汉末年,十常侍专权,外戚何进为了除掉十常侍,引西凉军董卓入宫。董卓入宫后,为彰显威严,招安吕布,废刘辩立刘协,杀害刘辩和何太后。由于董卓在朝廷专横跋扈,士大夫群情激奋,组成了一个十八路诸侯联盟,盟主是袁绍,准备讨伐董卓。董卓带着吕布出战,最后失败。

失败之后,董卓焚烧洛阳的宫殿,迁都长安。后司徒王允用自己府上的歌伎貂蝉,巧使连环计,先说把貂蝉许配给吕布,后又送给董卓,由此挑拨离间董卓和吕布的关系。后来,董卓发现吕布和貂蝉在凤仪亭搂搂抱抱,董卓大闹凤仪亭,自此董卓和吕布结怨。貂蝉于是劝董卓搬家,于是他们搬家到郿坞。后来有一天,王允和吕布假借汉献帝召集文武百官进宫吃饭,董卓欣然进宫,被早就埋伏在此的王允、吕布等人杀害。

董卓死后,董卓手下四员大将李傕、郭汜、张济、樊稠在西凉起兵,进攻长安,烧杀抢掠,把王允也杀了,国家大权落到了李傕和郭汜手中。后太尉杨彪使用反间计,离间李傕和郭汜。于是,李傕和郭汜之间爆发战斗,李傕劫了天子,郭汜劫了文武百官,每日厮杀。后来张济讲和,李傕卖个人情,开始移驾弘农。在路上遇到杨奉董承双救驾,劫驾成功。败走的李傕后来又和郭汜合兵一处,开始反击。后杨彪引曹操入宫护驾,曹操大喜,进宫后干翻了李傕和郭汜。自此董卓基团覆灭。

Continue reading

《三国演义》每回内容梗概(91~120)

第九十回 驱巨兽六破蛮兵 烧藤甲七擒孟获

孟获第五次失败后,去拉外援了。第六次叫来了另一个洞主木鹿大王,能呼风唤雨,能指挥虎狼豺豹。被诸葛亮用木制巨兽打败。第七次请来了乌戈国帮忙,乌戈国人都穿藤甲能防毒水,于是诸葛亮设计火攻,大败乌戈国人。

就这样总计七擒七纵,最后孟获心服口服,归顺诸葛亮。

Continue reading

《三国演义》每回内容梗概(61~90)

第六十一回 赵云截江夺阿斗 孙权遗书退老瞒

却说孙权想乘刘备入川的时候,武力讨回荆州,于是想了个法子,派人去荆州找孙权的妹妹(刘备的老婆,孙夫人),说老母亲病危,让她带着阿斗快点回东吴。孙夫人信以为真,火急火燎带着阿斗走了,也没告诉任何人。走的途中,被赵云和张飞追上,夺回了阿斗,孙夫人一个人回了东吴。

此时,北方的曹操又南下攻打东吴,孙权只能暂时不管荆州,转而抵御曹操。曹操和孙权互相打了几个月,互有胜负,后来春雨连绵,困苦异常,曹操想撤军,又碍于面子。正好孙权写了一封信给曹操,劝曹操快点撤退吧,给了曹操一个台阶下,于是曹操就撤军了。

Continue reading

《三国演义》每回内容梗概(31~60)

第三十一回 曹操仓亭破本初 玄德荆州依刘表

袁绍手下主要有三股势力:长子袁谭守青州;次子袁熙守幽州;三子袁尚,后妻刘氏所生,绍最爱之,留身边,守冀州;外甥高干守并州。听说袁绍官渡之战败了,都来支援。于是袁绍聚集四州兵马,屯兵仓亭,准备再和曹操干一仗。结果,曹操谋士程昱献十面埋伏之计,大败袁绍,于是袁绍回老巢,转为防守。

却说刘备势力趁曹操忙于官渡、仓亭之战,偷袭许昌。曹操打败了袁绍之后,赶紧南下收拾刘备。刘备大败,谋士孙乾建议投靠荆州刘表。刘表谋士蔡瑁进谏:不可。刘备先从吕布,后事曹操,近投袁绍,皆不克终,足可见其为人。今若纳之,曹操必加兵于我,枉动干戈。不如斩孙乾之首,以献曹操,操必重待主公也。不过孙乾凭口才和智勇,打动刘表,刘表同意接受刘备。

Continue reading