跳转到主要内容

听:计算机科学家阿米索尼说“谷歌将看到你现在博士”

听:阿米索尼“谷歌将看到你现在博士:推进生物学和医学人工智能”

音频播放器控件
0:00 / 0:00

今年春天,计算机科学助理教授阿米特索尼演讲,”谷歌博士将看到你现在:推进生物学和医学人工智能。”

当前人工智能革命引发了两个正在进行的趋势:并行体系结构,使计算速度更快,“大数据”——能够收集和共享大型数据集容易和廉价。在他的讲座,索尼在他的研究的背景下,探讨这些趋势发展算法来解决问题在生物学和医学。这些问题的特点是复杂和嘈杂的关系压倒常用方法。他探讨的项目包括解决蛋白质结构预测、诊断疾病,如阿尔茨海默氏症和帕金森氏症,和理解基因调控。

索尼,他于2011年加入斯沃斯莫尔最佳线上娱乐学院,收到了他从威斯康辛大学计算机科学博士学位。他的研究兴趣是在机器学习领域,计算生物学和医学。


音频记录

富Wicentowski:下午好。我的名字是Wicentowski丰富,我想介绍一下我的同事,阿米索尼。阿米特从密歇根大学拿到了学士学位,2004年很明显,现在我有义务说,“蓝。”He got his MS and PhD at the University of Wisconsin in 2011 and joined Swarthmore College immediately after as a visiting assistant professor. The following year he was hired on the tenure track as an Assistant Professor in Computer Science. Since he's been here he's taught bioinformatics, database systems, data structures, introduction to computer science and numerous directed readings.

阿米特的主要研究领域是机器学习及其应用生物医学问题。为他的博士论文,阿米特致力于发展中机器学习方法对于复杂的问题,包括预测蛋白质的三维结构,他今天会讨论。自从加入斯沃斯莫尔,阿米特和最佳线上娱乐他的八个学生使用机器学习研究上取得进展的生物医学问题。

目前,阿米特的实验室使用深度学习预测转录因子如何影响基因调控。转录因子是蛋白质,控制特定DNA序列的转录成RNA,它有效地将一个基因打开或关上。阿米特的实验室还利用深度学习来确定MRI显示病人是否有老年痴呆症。

在校园里,阿米特已经成为涉及很多方面,包括给董事会经理客座讲座题为文科的未来,给客人在认知科学讲座,指导青年教师,参与Aydelotte教育学基础系列,和NFC代表在浴缸里辩论,克里,他排在第二位。

当然,我如果我没有提到几个计算机科学系认为阿米里的每个人都是一个完美的同事。谢谢光临和享受。(掌声)

阿米特索尼:谢谢大家今天的光临。我很高兴和你谈谈我的研究。因此,我的研究的主要主题是应用机器学习技术在生物医学问题。我会和你谈谈这些不同的领域是什么意思和他们工作上的一些问题,希望给你一个了解我如何看待一个问题,在我看来解决问题的视角。

所以,我使用人工智能在主幻灯片,因为我想我们更熟悉这个词。具体来说,在人工智能领域,我工作在机器学习问题。所以,人工智能,我们考虑为机器人和试图模仿人类。而且,你知道,我们有这个科普的观点是什么。机器学习是一个完全不同……或者它的子问题,我们不一定感兴趣也许人机界面的一面,但更多的是我们如何从数据中学习呢?所以我们如何取数据,能够识别模式为了能够解决问题在现实世界中,而无需告诉机器每一个可能的场景,它可以看到,如何解决。

所以一个例子给建议。所以,我将使用这个玩具电影推荐的问题。如果你Netflix,有人的浏览历史。你想要擅长它们,因为如果你不推荐电影,人们会停止支付为你服务,因为他们认为没有更多的电影,将会是很有趣的,但如果你真的好,他们会更快乐,可能继续。所以一个典型的机器学习问题可以查看器的历史,你能预测是否会像个电影出来,月光?更具体地说,如果你有信息以及其他用户可能有类似的观看历史的新用户。

在一个理想的世界里,我只能说,“嘿,Siri,帮我解决这个问题。”Where we just want an AI that we don't have to give it much information. We can just tell it what our problem is and they can solve it. But in reality, the truth behind artificial intelligence is that most of the intelligence is still human intelligence. Right? So when we think about when we want to solve a problem, in the vast majority of successes at this point, it's the human has to select a model, a mathematical construct, or a way to frame the problem in a way to the computer, and also has to curate the data and collect the data. So if the human is not very good at any of those aspects, the machine's not going to be able to learn anything about the data, or it's not going to learn anything very useful from the data.

因此,它仍然是非常重要的建立技能和理解这些模型如何工作和数据如何影响这些算法的理解。

这是一个玩具的问题。再一次,这不是像一个惊天动地的问题或类似的东西,但建立了Netflix的问题。假设我有一个观众的历史,所以我们称之为监督学习。我们给机器一些解决的例子,所以人们,像月光,人们不喜欢月光,我们希望能够概括。所以在未来,你能告诉我如果一个新用户可能喜欢这部电影吗?假设我有浏览历史,我有变形金刚和隐藏的数字,我认为可能会有关系你思考这些电影,你是否喜欢月光。所以在蓝色我们有像月光下的人。这是我们训练,著名的例子,在红色我们人,也许不喜欢月光。所以我们希望能够开发一个模型,可以告诉我们关于未来的例子。

所以我选择数学模型。我要选择一个非常简单的一个。我要有一个…抱歉。我们有一个新的人进来。我知道他们喜欢隐藏人物,我知道他们是否喜欢变形金刚,我想用这个信息来告诉我一些关于我是否应该建议月光。所以我的数学模型是非常简单的。这只是一个简单的线性函数。我要说如果你低于这条线,你会喜欢月光下如果你上面这条线,你不会像月光。对吧? So, this is the first step that I came in ... the second step. The first step was collecting the data. The second was what model do I want to use to be able to learn from the data?

因此,一个简单的模型,但是我现在可以很轻易做出这个决定。我有一个模型,我有一个例子。是线下就像所有其他的人喜欢月光,所以我要说这个人应该推荐看月光。所以,这是一个简单的版本的机器学习是什么,试图使用数据模型能够回答问题。就的,这里的模型是这条线。所以当我使用这个词,我说的是一些数学的解决方案,帮助我们能够预测未来。

有什么问题吗?好了,很酷。很明显,这不是我的整个谈话。它是比这更复杂。所以,是的,卡洛斯?

卡洛斯:是什么在最后一张幻灯片你电脑做什么?

阿米索尼:是的,所以我的手挥了挥手。有一些优化阶段,这就是计算机的做它的魔力,但是我们有不同的方式接近这个问题。所以我们可以说,形成一条线,也许是在尽可能最好的数据点之间或得到尽可能多的东西正确。所以你知道这三个应该像月光一样,如果你的模型,这三个应该放在一边,这些其他三个应该在另一边。

所以我们可以有不同的目标函数,但精度通常是一个。所以我们要减少错误我们正确了解的东西。我们可能有其他事情可能更喜欢。对于任何熟悉奥卡姆剃刀原理,我们更喜欢简单模型。我可以适应一个非常时髦的多项式方程,但我宁愿是一个更简单的解释。

对生物学非常重要,因为我需要解释我的模型的生物学家或一个医学的人,所以他们希望我的模型不是这些非常复杂的数学方程式,真的不给任何深入的问题。

这是大数据营销术语被扔在海量数据很多。我更喜欢,因为我认为在这一点上我们得到更多的问题比解决方案。但是如果我们想要谈论它在特定的细节,有四个V的客户描述什么是大数据。这是——这是一个连续体;它不像我们去年刚刚开始大数据和之前没有大数据。但是这些是我们对大数据的一般性质。我认为每个人都可能是熟悉第一个。这就是我们看到的新闻。大数据意味着你有很多,所以我们需要更大的硬盘和更快的计算机能够处理它。

我更有趣的最后两个,最后两个。所以速度是我们有fitbit和智能手机。我们不关掉这些。他们总是收集数据,所以我们需要想出模型能够更新为新数据,的一个新问题。大数据的真实性是一种后果的繁荣。

所以我们收集数据主要因为它是更便宜、更容易收集,但是能够保持质量明显下降。因此,传感器是便宜,但这并不意味着他们更好。它只是意味着他们可以收集大量的信息。第二件事是我可以走之前,你知道,我们会收集100例的数据集。我们可以看看所有这100例子来看看是否有任何问题。所以我们可以很容易清理数据。

如果你谷歌和你有百万计的图像,你真的不打算雇佣人坐在那里,筛选这些图像,以确保那些实际上是狗或猫的图片。所以我们有更多的噪音,我们不得不面对这样一个事实,我们的数据可能不是它说它是什么。品种是我们的模型用于简化问题思考一种类型的数据。如果我想看看预测癌症,我们可以看看血液样本,只是说让我们收集一堆病人的血液样本,看看,告诉我们任何关于癌症。但随着大数据我们已经能够收集很多不同类型的数据,所以我们可能会有血液样本,我们可能有基因数据,可能大脑图像。我们有所有这些不同类型的模式或不同类型的数据,我们需要一个数学框架相结合。和我们的老模式不一定很容易推断这个新设置。

所以最后两个,各种数据和数据的不确定性,是两个,我真的想在关注。它给一些实际的例子。假设我把我之前的例子,但事实证明,沃伦比蒂是我的一个用户和贴错标签是否他们喜欢月光。所以我有噪声的数据。他真的像“月光”。He wanted to say Moonlight, but he said the wrong thing. And so what happens here is it changes my model, right? So if I fit my model to the data, assuming that the data's good, I'm going to get a very different model than I had before. So we want to come up with robust solutions that can not necessarily believe everything it sees in the data, take it with a grain of salt.

在品种方面,我想专注于我们所说的依赖关系或结构。所以在今天的统计数据,他们有独立的想法。我们假设我们收集的数据收集彼此独立的。Netflix的情况下,我们假设有两个用户并不真正相互影响的他们是否像个电影。所以他们只是来自该分布的人喜欢看电影,不喜欢。假设我有两个人,我想预测的样本。我可以画线,这条线使用预测是否喜欢这部电影,但我们现在有其他信息。我们知道,人类形成社会网络,也许我们有很多文献说彼此是朋友的人有类似的电影偏好。如果我们处理医疗场景,也许我知道一个人的另一个病人的父母。知道他们相关的基因应该影响我是否认为他们都有相同的疾病; right?

所以在这里,我假设最初他们相互独立的,但是现在我知道这两人是朋友,我希望他们喜欢的电影相似。我想把这个因素考虑进去。如果其中一个喜欢月光,它应该影响是否对方喜欢月光。所以我们要想出模型添加这个结构在当我问人就像月光,我考虑不仅观看历史,还他们的社交网络或者其他类型的结构化信息。所以真实的数据是相互依存的。有很多影响。

的总结,我对机器学习感兴趣,我感兴趣的算法适应情况有很多噪音或不确定性数据和依赖关系的数据。如果我得到异质性,希望我会有几个幻灯片结束时对帕金森病,我们最近走了出来,我想去。

我非常感兴趣在计算生物学和医学应用这些问题。部分原因是,我希望这些算法的影响。很多机器学习纸已经使用这些老累数据集手写识别和数字识别。他们是有用的。他们有用的基准,但你知道,如果我告诉我爸爸我做什么,我告诉他我把数字,他真的不理解为什么我们要这样做。

不过,第二个问题是,很多时候,这些模型都是建立在[听不清00:12:24]的具体问题。所以他们在一个简化版的一个场景,他们考虑。生物学和医学问题有更多的复杂性和更多的资源需求比其他一些数据集。所以我认为他们是很好的测试床计算机科学。

有两种方法,我今天再谈。主要的主题,主题将连接的两个主要部分,前两个主要的部分,是概率图形模型。别担心。我进入的是什么,但这些都是我用的一般类别的方法。第二件事是深度学习,我花了过去一年工作,希望和你谈谈这一点。

这里的设置方面有问题吗?好了,好了。

图形化的模型是什么?或为什么我感兴趣的一个图形化的模型?这是一个数据的数学表示。如果你有打开空气飞行——如果你在飞机上,你打开杂志后面的页面,它显示你所有的机场枢纽和航班,这是一个图。它显示你的城市圈。他们是某种类型的变量,然后显示边缘,航班连接起来。我使用一个特定的变异,概率模型的变量类型的信息我也可以。所以我想预测一个人是否会进入研究生课程,和类型的信息我是他们的大学本科是什么,他们的平均绩点是什么,他们的专业是什么。所有这些事情会影响他们是否会得到一个研究生项目录取。

第二件事,与这些模型的合并是某种概率测度。所以这不是一个是或否的答案是否你会得到承认。这是一个猜测。有75%的机会你会得到如果你的平均绩点是4.0,也许吧。好吧。所以我们要有这种程度的不确定性模型。边代表某种连接或事物之间的依赖关系。所以我可以问一个关于招生的问题,但我也可以问一个问题主要与GPA之间是什么关系?我们想知道哪个部门,你知道,有大通胀最,之类的。对吧? So we could ask other questions in this graph, based on these individual local parts.

我会进入计算的原因我用这个在一些具体的例子,但大意是,表示在图让我们一个非常大的问题分解成更小、可管理的块,否则不会计算可行的方法。

这是一个高级的概述的一些我最近一直在做的研究项目。所以我要详细一些,但我想通过这两种方法我谈到:图形化模型和深度学习。所以这些前四在某种程度上使用某种类型的概率图形模型。无论是分析蛋白质结构,分析文本,能够预测帕金森病或能够大脑图像分析。我真的很喜欢他们的一部分原因是他们非常灵活,可以看到这里有非常不同的问题。

最后这两个我也使用深度学习的方法。所以我要专注于蛋白质结构和大脑图像分析。这些可能是两个比较成熟的领域而言,我的工作有一个完整的故事。其他的一些东西还在进行中,但我想他们也给一个想法的我方法一般问题……一般的问题。

好吧。有什么问题吗?好吧。太好了。

所以我的论文工作,丰富的提到,蛋白质结构预测。所以要分析图像和能够产生某种结果。所以为什么我们对这个感兴趣吗?我认为在科普方面,我们考虑基因和DNA是非常重要的。所以我们经常谈论什么DNA对个体或基因的目的是什么?但是我们总是要记住基因和DNA蓝图;他们的说明书。他们实际上不做任何自己的大部分。所以,对不起,生物学家,如果我避免了很多细微的差别。你可以打扰我。

DNA本身并没有告诉我们全部的故事。它的起点。基因大部分编写产品称为蛋白质。这些都是实际的马在细胞环境中工作。如果我有一个基因参与,比方说,运送一些营养细胞,这是一种蛋白质,这种蛋白质。蛋白质抓取到营养和移动它该去的地方。

所以如果我们想要理解什么是真正的功能基因,我们需要理解的结构,由于结构实际上就是与环境的交互能够四处移动。如果我们希望能够设计药物,有疾病,我们希望能够攻击蛋白质,理解蛋白质的样子让我们能够设计药物,可以禁用蛋白质。或者,如果我们想了解一种疾病,我们想知道发生了变化。好吧?所以朊病毒,例如,一个特定的蛋白质,导致疯牛病……是一个例子,当它改变蛋白质的样子。

所以我要试图通过尽可能多的生物学。我不是生物学家,但我希望你明白这个问题的复杂性。所以就像我们有DNA, T, C,和G的字符序列,它转化为氨基酸序列或蛋白质序列。所以蛋白质是从这一维或标签上的字符链一个接一个。你可以考虑作为构建块,像乐高玩具,有20种不同类型的乐高积木块你可以拼凑起来,但是你可以一块一起在任何不同的方式,你可以有相同的倍数。

这形式长串连接分子,这开始形成一个三维结构的折叠。从这个简单的过程,一维链三维结构是一个开放的问题,没有解决问题,令人难以置信的复杂。对吧?我们可以理解从非常小的蛋白质,但对于大型蛋白质很难理解。有很多研究进入它。所以我们希望能够确定这些结构。

为什么这是有趣的吗?种来更多的数据来证明这个观点。

是的,查理?

查理:我们如何得到这些图片?

阿米特索尼:噢,我将讨论图像。

这些都是解决结构和这些只是不同的方式来表示它。所以他们非常复杂,生物化学家和生物学家可能想以不同的方式看待它。所以这是两个抽象的所有原子模型的方法。这是代表的主要原子模型。它仍然是大量的信息。这一试图代表通用的模式,你看到的蛋白质。就像这些粉红色的线圈这些东西被称为α螺旋,螺旋,而这些黄色的区域是有点像煎饼。形成这些表层重叠的。这些只是全原子模型的简化表示。

所以我将讨论如何确定这些模型实际上是什么。我们认为这非常大的序列的增长。所以在红色的组合数,它变得非常容易……蛋白质序列或变得更便宜。所以我们认为这有些指数增长,这是几年前,所以我想我们过去的2500万在这一点上的蛋白质序列的数量,我们知道。

蓝色的,你可以看到蛋白质结构的数量。它不是一个错误,它的下面。对吧?小信号下有已知的蛋白质结构的数量。所以之间的差距的组合数和结构的数量增长很快,和结构的数量不是扩展。我们约在成千上万的数量结构与已知序列已知的数千万。好吧。我们学习了很多关于序列,可有用但不是我们真正想知道的。

几乎所有这些结构已知生产通过x射线结晶学方法得到。所以化学家,蛋白质的生物化学家将一个图像拍摄x射线,他们得到的这张照片,一个人会通过和各个部分的蛋白质模型能够结构。和生物化学家,他们的很多路障,特别是当你得到更复杂的生物。如果你处理细菌,蛋白质结构可能更简单和容易,但是当你得到更复杂的生物体和更复杂的功能,蛋白质变大,难以采取的图像。所以他们想提出计算方法,他们可以使用作为一种工具来帮助。

所以我的论文的任务是,如果我知道蛋白质序列,我知道所有的积木,进入一个特定的蛋白质,和我有一个形象的蛋白质,可以产生一个模型,该模型适合所有的碎片到形象吗?我想做一个化学的方式可行。它不能违反任何化学或物理定律。你有三维图像,这些实际上是很好的图片,只是为了给你一个例子。但在蓝色的在这里,你会看到很多密度,你看到很多问题,我们希望能够适应蛋白质的蛇。再次,这是一种一维字符串,就其方式在这个模型中形成三维结构。

那么,为什么这是一个困难的问题吗?正如我提到的,图像质量决定是多么容易解决这个问题。如果我们有一个非常高分辨率图像或数较低,所以一埃,我们得到了很多定义,很容易看到的东西。这是一个类型的氨基酸,这双环形结构特征。图像中我们可以看到双重环。但随着图像分辨率变穷,我们开始失去了几乎所有的重要的定义。

所以有很多的方法来处理这些简单的图像。他们可以解决这些很快,也许在30分钟到几小时。但有一个缺乏行之有效的方法在这些困难的结构。这不是一个问题,得到一个更好的相机;这是一个问题的蛋白质要拍照。这就像一个蹒跚学步的孩子拍照而拍照的雕像。幼儿不坐着,你让这些大涂片到处当你试图拍照。同样的事情发生在一个蛋白质,因为它不想安静地坐着,很难形成这些晶体结构,使其容易获得高质量的图像。

我们有这些重要的蛋白质,我们想知道,我们不能得到更好的解决。那么,我们如何解决这个问题在这个框架?所以我们的方法叫做整线,自动晶体图解释。以后会有一个小测验。我们的方法是什么?所以我想首先从计算的角度谈谈为什么这很有趣。这很有趣,生理上我们想知道蛋白质是什么样子,很难做一个人。所以在那些低质量的图像,他们通常只是懒得因为低挂水果,其他一些蛋白质可以解决,或者需要六个月到一年的一个生物化学家团队来解决这个问题在一些极端的情况下,我将讨论。

这是一个好的测试床上计算,因为这些都是非常低质量的图像。如果你有方法能够分析图像,很高兴看到他们如何工作最难的问题。而言,能够思考所有可能的结构蛋白的方法,可能有更多的结构比我们可能数如果我们整个一生的计算周期。让我们想一想。

我将给你一些实实在在的数字。这些是三维图像。他们大约100 x 100 x 100,所以100 x, Y的100 100 z,但如果我们要多,大约一百万种可能的位置每个原子可能在这张照片,我看。块我要用,分解的蛋白质,氨基酸,所以大约有一千……数百到数千氨基酸在蛋白质。如果我多,数量1其次是0,0,0,0,六千0之后,零。这是一个非常大的数字。对吧?如果我们想到宇宙中原子的数量,这是1 80 0紧随其后。这些是数量级的更加困难。

我不会在考试中能够把这个,问一个学生来解决这个问题。至少直到我获得终身职位。所以我们不能很容易地解决这些问题。研究生院的笑话我总是说这就像一个对类固醇的Waldo的问题。对吧?这只是一个非常困难的图像分析的问题。

到目前为止有什么问题吗?

发言人6:[听不清00:24:17]

阿米特索尼:这是个很好的问题。问题是你如何分析你是否得到了正确的结构?

说到人类,他们想出一个结构时,有几个技术,他们可以使用。他们可以谈论什么是匹配。如果你有一个模型,你可以估计密度你期望什么,你可以说多少与我们的实际图像重叠。你可以做的另一件事是你可以保留图像的一部分从生化学家,10%的形象,让他们解决结构,然后带回,10%他们看不到,看他们如何配合。所以如果他们想出了一个坏榜样,他们不会做在他们看不到的部分。但如果他们有一个好的模型,他们可以匹配在看不见的地方。我们如何分析他们的模型,我将在一分钟,计算方法。

其他问题吗?好了,好了。

亚洲是一个多个相控算法。我不会讨论所有不同的部分;这是一个团队的努力。我想专注于那部分我取得了最大的贡献,我的主题图形模型。所以去那里,拳头我想谈论的是我们的第一步,这是,嗯,我们有一个非常困难的问题。有10的6000数量的可能性。我需要分解成小块。

所以我们要做的是我们要把这个巨大的链,这种蛋白质,我们知道的是图像中。,我们将它分成剁成小块,小块。所以我不知道什么是完整的解决方案,但这些小块,只有20个可能的构建块,我们可以使用。还有其他的结构,解决了其中的一些碎片。所以我们要做的是我们要看看所有这些其他结构,看看有什么解决这个很小的块具有良好的匹配。我将使用这些小块和扫描图像,看看其中的任何一个匹配我们的形象很好。Waldo的类比,你可以想想,有人解决Waldo的书和切断所有Waldo,交给你,和你有一本新书,所以你需要每个Waldo和扫描页面上看到,他们会匹配任何页面的一部分。

是吗?

李拉:那么你有足够的决心找到这些碎片吗?

阿米特索尼:没有。嗯,是的,没有。对吧?很明显如果没有信息,它不会是有用的,但我会谈谈为什么它仍然是一个困难的问题,即使我们有一点点的信号。

问题是:是否有足够的决心找到能够做到这一点吗?

我们有足够的只是得到一些不错的信息,但不足以完全解决这个问题。所以我们得到的最终结果是…如果你不感兴趣的概率方面,想想这个,是给我们一些可能的答案。所以我们从一百万到几个可能的匹配,我们发现在这个形象。所以这是一个很好的过滤步骤,但是为什么,进入李拉的问题,为什么不是终点吗?这些图片非常嘈杂的或非常可怜的决议。它将匹配的东西,彼此blob即使他们不是一样的,只是因为没有足够的信息。

所以我们仍然会为每个氨基酸一百可能的解决方案。我们从一百万年到100年。这仍然是一个很多零紧随其后。不是6000了,但仍然太多的处理情况。

另一个问题,我们都是我打破这些分成小块独立,对待他们,这很好,当你有很多的电脑在实验室不做任何事情,因为他们每个人可以解决一个单独的部分。但不考虑结构的依赖关系,对吧,当你从一维到三维因为原子相互作用。所以我完全无视那些可能的交互模型。所以我们没有大局。我们有很多的树,但没有森林,森林的看法。

所以我希望能够解决这个问题,这是我们的第二部分算法。这是图形模型的由来。图形模型数学构造,我们要把这个问题,这个问题模型。所以在一个高水平的论文圈子,我们称之为节点,它们代表了一些变量。《第一圈》在这里代表蛋白质的第一块,一些小的部分我会打电话给丙氨酸的蛋白质。构建块的具体名称,但它可以随你看任何蛋白质。

它有一个想法的丙氨酸没有真正了解任何关于剩余的蛋白质。我刚洗了一个很小的一部分蛋白质和我问它认为它是。这就是我们在前面的Waldo的阶段。所以我有这些非常嘈杂的估计。一个节点总是问:我在哪里?我应该在这个三维大的箱子吗?

是吗?

发言人6:你可能已经说过这个,但是你已经知道所有的氨基酸都出现在给定的结构。你不是也用氨基酸的图书馆。

阿米特索尼:没错。是的。所以我们知道的氨基酸组成一个特定的蛋白质。是的,这是正确的。是的。这就像如果我告诉你我拍了张照片关灯讲堂我告诉你班上的学生,但现在我想让你们找出所有的学生都在这张照片,但这是一个很差的质量,我想找出学生在哪里。所以我们知道零件是什么;我们不知道他们在哪里。

节点总是将它认为是哪里的信息,和边是我们的方法是找出什么是大局。边缘执行某种物品之间的依赖关系。所以原子相互作用;他们不可能在同一时间在同一个地方。这是物理上不可能的。但我们也知道有一些之间的债券,他们必须在一定的距离彼此以物理是可行的。所以我们的边缘可以将这方面的蛋白质结构。所以另一种方式说这是节点所有的本地信息,边缘告诉我们一些全球信息我们需要纳入模型。

好吧。我一直说这个,但问题是,这仍然是一个困难的问题。对吧?所以我们有这个图。这是一个非常大的图所以我只显示你的一小部分,但它确实是成千上万的圈子里,数千个节点,数以百万计的这些节点之间的连接。所以试图能够算出确切的最佳答案仍然是一个非常困难的问题。还有比我更猜测有计算的时间。这不是一个问题,英特尔需要推出一个更快的处理器;这是问题本身的性质。

我们决定使用一种叫做愚蠢的信念传播算法。呆头呆脑的信仰传播,如果我们要考虑它在一种直观的层面上,是一个游戏的电话。我们这些各个部分的问题,我们不能沟通起来与此同时,每个人都同时大喊大叫。不计算。所以我们要做的是我们要把成对的信息。所以两个部分的蛋白质会互相交流关于他们应该如何影响另一个。所以我们要通过在我们所说的消息。作为一个供参考,这是……犹太珍珠这个算法获得图灵奖几年前,就像计算机科学的诺贝尔奖。这是一个非常重要的算法在人工智能和机器学习领域。

像往常一样,总是容易的看一个例子,而不是一堆单词。这是一种形象,可能会帮助你了解消息通道在做什么。我孤立的两个很小的部分的蛋白质发生相邻。你可以考虑部分31和32。

在这个例子中,赖氨酸和亮氨酸。每个节点都有一个它认为可能是哪里的想法。赖氨酸的认为这是这四个山峰,这四个地点之一。这些是二维图片。我不能画四维图像,因此我们预计成两张图片,两个维度。和亮氨酸认为这四个地点之一。所以你知道只有一个正确答案,但我们不确定这四个会。

赖氨酸的要做的是它会说,嗯,基于我相信我的现状是什么,我要送你一个消息;我们结合在一起。我们彼此有化学键,所以我们必须在一定半径。所以我要做的就是我要给你发个消息说,好吧,我在这里,你需要这个光环区域附近的我。对吧?所以我有这四种可能的领域。所以你应该在这四个地区之一。

亮氨酸会利用这些信息结合起来,认为它的位置。这是要把这两块结合在一起。所以只有重叠要维护的东西,和那些不同意对方会下降。这些都是概率,所以我们从来没有下降到零,很少下降为零。我们会down-weigh东西。

所以很难看到,但这四个山峰曾经是相同的高度,现在一个是比其他的高多了。原因是它同意消息比其他三个峰值。这是一个迭代算法。我们多次传送信息在某种程度上我们要重复,但我们要向后发送一条消息。所以亮氨酸说,好吧,现在轮到我来告诉你我的想法。所以它会再次计算甜菜碱的消息。它仍然有四种可能,但其中一个是高多了,所以它会说,你需要在这个我所在的半径。

我忽略的角度。这里也有角的问题。再一次,我不能画在六维空间很容易。

所以我们要有消息发送和赖氨酸更新其概率。我们开始看到这种非常嘈杂的第一轮我们数以百计的可能性开始过滤到全球一致的事情。因为如果你有两个可能的猜测并不匹配,其他的他们会下降。但是如果你有两件事是一致的根据我们的全球图景,那些会up-weighted。

是吗?

查理:你能得到不同的答案,这取决于信息是第一?

阿米特索尼:是啊,太好了。实际上我给这个演讲前5分钟,我放弃了五个幻灯片讲过。我很乐意和你谈谈后脱机或讨论;那就没事的。但,是的。

我们如何通过这些信息是非常重要的。类比是如果你玩大游戏类的电话,你不想拿孩子永远是第一,因为那个人会发送错误的信息给别人,现在我们把不良信息被传播。所以我的论文是关于智能地选择我们如何安排事情。这可能是我最喜欢的。这让我最佳论文奖的斑块。这就是为什么它是我最喜欢的。

好吧。那么我们如何评价呢?这涉及到的问题,我们从房间的后面。我们要做的是我们希望能够解决一个新的结构和说我们做得很好。问题是,如果我们解决结构和之前没有人能够解决这个问题,你必须相信我们的话,我们是正确的。对吧?或者我们必须想出一些方法验证我们的结果。

所以我们要做的是我们跟生物化学的同事,我们与我们问他们,“你有什么10困难的例子,你可以想出?”And they gave them to us; we got 100%. So we went back and we said, "Can you try a little bit harder?" So they got 10 more they fished out with some other groups that they collaborated with, and they gave us the 10 hardest maps that it was for ... 10 hardest solutions that a human ever came up with.

在所有情况下,它花了几个月到一年的人类来解决。即使这样,他们不是100%确定他们有正确的答案,但是他们有一些答案,我们可以使用。我们把这10个蛋白质,我们把正确答案,所以我们只有图片,非常贫穷的图片,我们有序列。我们想要年级算法。我们想给它一个检查,看看它对这些键。

所以我们人类的解决方案比较。我们也想看看我们在做反对艺术的状态,最受欢迎的晶体学家们使用的方法。我不打算对这些算法进行深入研究。在这个本地/全球的主要主题是困境,他们几乎优先本地信息,如果它与全球信息匹配,竖起大拇指,但他们不会回去说,“好的,让我们试一试。”的y're called greedy algorithms. They take the best step first, and then they just go downhill from there. And if it goes to the right place, that's great, and if it doesn't, oh well.

肯定有牺牲的速度与准确性。作为一个例子,我的论文很难完成的原因是,我的一个蛋白质一周上运行的软件。所以我想出了一个主意,我计划它,然后我不得不一周后回来看看。所以我总是要做像同时五个不同的分支。(听不清00:36:18)当时存在,但它没有,也不是很准确。不是很好使用。

我不知道发生了什么。好了,好了。

这是10的结果图像。所以我们平均模型的准确性对人类产生什么,可以看到——不要担心蓝色和红色。红色只是意味着你发现在正确的地方。蓝色意味着你不仅把东西放在正确的地方,但这是正确的氨基酸。所以如果你翻转结构,你仍然可以得到一些信贷。你可以看到我们的一部分,这是最受欢迎的人,只能得到20%甚至在最慷慨的措施。而我们的方法在蛋白质结构能够获得80%的准确率。所以我能够重建80%。

事实上,当我们说生物化学家,他们的一部分,格兰特是开发这个很酷的洞穴,我们可以进入。这是一个虚拟的洞穴,你可以在3 d可视化蛋白质。每次都让我头晕目眩,但我们会,我们会看看我们的解决方案。他们会说,他们会跟我说话,特别是在其中一个,他们说,他们认为我们的方法是正确的,人类是不正确的。我们评分对人类,但这并不意味着我们错了剩下的20%。

有什么问题吗?是的,丽莎。

丽莎:糊涂的传播算法,它只是随机?你保证每个连接试一次吗?

阿米索尼:我们做了一个循环,所以如果你有一千块就有四个回路,说做一个,两个,三个,四个,到最后,然后倒退。所以我们只是减少来回。这是一个非常公平的算法。

莉莎:好。

阿米索尼:幻灯片到达我的结论,我将讨论在另一个第二。

我们的结论是这是我第一次与图形化交互模型和为什么我爱上了他们。他们处理不确定性和噪音很好。他们还模型在结构和数据依赖关系很好。问题是我们需要开发更高效的算法能够对它们做分析。

一些其他的工作…所以这些论文之一是消息传递算法。所以我跟生物化学家如何安排信息。我问他们怎么解决结构。这纸是关于专家问如何解决问题和数学结合到算法中。我们做的是和一个生物化学家,他告诉我们,他们看分子的中心。特别是,他们看的部分,他们知道要稳定。所以有这些东西叫做α螺旋。所以我做的就是我说的,好吧,告诉我你想在这个序列是一个α螺旋。他们的东西给我,我把它分成算法和优先考虑这些信息,这极大的提高了算法精度。

这是一个通用机器学习纸我们需要如何设计算法,不仅看数据在效率方面还考虑裁剪它特定的问题。如何让人类的循环。

这是我在威斯康辛州工作。非常感谢生物化学集团,我的合作者在计算机科学。我能在这里工作了一个夏天Stella曹和艾米丽Dolson,我们有一些很酷的结果。

我做的最后一件事当我完成了我的论文,我坐下来和一个博士后,他想结束他的博士后。他不能解决一个结构。我们彼此来回工作,和我们能够解决这个结构和存款PDB。所以它很酷;他们把我的名字在PDB和他们得到一个弹出的结构。所以,他只能得到10%。其他计算方法只能得到5%。与我们的方法,我们只有50%,但50%,他能引导其他的解决方案。

好吧。有什么问题吗?好吧。

所以,我要继续我的演讲第二部分,这是大脑的图像分析。所以我们想看看大脑图像和能够诊断特定类型的信息。好吧。

我们最初的动机是能够攻击阿尔茨海默病的问题。所以,阿尔茨海默病是一种神经性紊乱,不幸的是很多人都很熟悉,它变得越来越…问题是随着人口老龄化和生活不再增加。目前没有治愈,也真的,我们甚至不知道如何诊断阿尔茨海默氏症,直到你做后期分析。原因是阿尔茨海默氏症看起来像很多其他退行性或brain-diminishing问题,包括老化。所以,这些早期阶段很难区分认知衰退老化和阿尔茨海默病之间的关系。

通常临床医生诊断这真的会在游戏后期当很明显痴呆。所以,我们真的希望能够帮助医生能够诊断更早完成这件事,因此,我们可以考虑早期干预措施,我们可以想想,也许我们还可以发现生物标志物,也许可以帮助我们理解疾病的事情,为什么会发生以及它如何发生的好。好吧。

我们有一个数据集,我们想看看。有许多不同的途径在这你能来这个问题。我们再看看三维图像,这是大脑的磁共振图像。他们非常高的分辨率。

体素,我要用这个词。体素就是一个像素,但在三维空间中。如果你不确定什么是体素,只是代替像素。所以,我们有大约一百万每图像体素。和其他伟大的事情是有一个长期的项目,他们一直在跟踪数百病人大约五年来,大脑图像,让他们看医生,做笔记在数据库中关于他们的阿尔茨海默氏症是进步。我们有很多丰富的信息,可以访问,我们可以开始分析。

如此之快,我的第一个夏天,我正与克里斯Magnano和一些合作者在维克森林。我们想了解神经科学家做图像处理。所以我们看起来,有大约30预处理步骤,他们这样做了,我们想了解所有的细节,只是理解,他们为什么做这些事情。

第一先驱步骤之一是,图像很吵,和有很多的细节,并且很难做分析人类,更不用说一些统计软件包。所以他们会将原始图像转化为组织的地图。所以对于每个体素,底层是某种类型的大脑组织。这是灰质,白质。它可以是你的头骨。还有其他小事情,比如脑脊髓液的。所以他们会将图像转换成这种简化表示称为组织分割。

最受欢迎的方法是做所谓的模板登记。所以他们把一群健康的人类,人类大脑中平均,有医生经过,看看这些大脑的组织类型是,说这是一个黄金标准的大脑是什么样子。好吧?所以,所有的大脑有一个解决方案关于细分应该是什么样子。所以现在你的解决方案就会变得相当容易。当你有一个新的病人进来,你把他们的大脑,使它适合这个阿特拉斯,这黄金标准。如果是小的或者稍微扭曲,你只是re-warp形象符合原始图像,然后,转眼间,你有你的灰质和白质分割。

给你大脑的一个例子是略有不同但他们re-warped这样正常的大脑。和那里的想法是,失真是由于一些图像处理问题。有人搬在核磁共振成像机器或有som……一只苍蝇飞进之类的。所以有一些问题与图像的技术。

问题是所有的大脑用于开发这平均大脑正常的健康的成年人。如果你想了解孩子或如果你想了解神经性疾病,这可能导致大脑形态学的变化,这将是变性的大脑,你现在失去信息,因为扭曲,看起来像一个正常的大脑。

我们看了数据,看到这个。希望你可以看到这一点。这是原始图像。这是一个人类……医生坐下来发现什么是灰质和白质。这是一个二维图像。这是一种从耳朵到耳朵片如果你看大脑,我们可以看到,这里有小斑点的缺失或不平衡双方的大脑。

如果我们看一下两种最受欢迎的方法来解决这个问题,他们做不同的事情。所以VBM只是切断了另一边,说,好吧,如果是缺了一边,我们就从另一侧失踪。座和填充它,很难看到如果你…从后面,但在装满了一些背景噪音,说,好吧,好吧,这是失踪,但有可能是,所以我们就填写一些随机噪声。

所以它看起来像…对我来说它就像一个坏猜测它认为数据应该是什么样子。我们真的有问题,因为他们试图了解阿尔茨海默氏症。我们不想让它摧毁我们的原始信息,我们的原始数据。所以我们的解决方案是一个图形化的模型,所以我们想了解的组织类型,但我们也要承认这样一个事实:组织类型是相关的。如果我们回头看看这张照片,白色点周围其他白色点,和灰色的点是被其他灰色圆点。他们不是相互独立的。白质存在白质旁边。

所以我们决定使用图形建模模型,这对我们。模型的顶部是我们的原始数据,我们的原始图像,底部是我们要预测的。什么是大脑的组织类型在每一个地方。我们使用这些边缘将它们绑定在一起,所以他们一起把预测。就像我们一起把Netflix用户是否会像月光,我们要一起把这些组织的预测。

我们所做的就是使用一个模型称为条件随机场和我们想要预测部分是否白质,灰质或其他,和我们说,如果你想预测一个特定的体素,其类,一类是依赖于其邻居到一边,上面和下面。所以我们这3 x 3立方帮助平滑这些预测。

任何时候你做机器学习,你有两个阶段。你有一个学习阶段,你想了解你的模型,然后有一个预测阶段。所以我们的学习阶段是我们想要知道这些是强烈依赖于边缘。我们假设边缘和它们之间的联系,但是我们不想假设所有的边缘有相同的重量,我们甚至不想假设所有物质……而他们中的一些人也许没关系的值是什么。我们可以把它们。

所以我们需要解决的大脑,所以人类监督过程。他们说这里有一些已知的解决方案。学模型,解释了这些数据,然后在第二部分,我们将给你一个新的病人,我们希望你告诉我们的组织分割是新病人。

那是我们的模型,我们希望能够实验和验证这就像我们的蛋白质。所以我们的模型是如何与其他方法相比,我们的模型是怎么做的,如果我们想推广不同类型的人群吗?

不幸的是,我们没有大量的可用数据。事实上,我们没有任何特定的阿尔茨海默氏症患者的数据。我们认为我们所做的,但事实证明他们只是使用这些其他统计包。所以我们没有一个人类地面实况为我们想要的数据。我们发现这个代理。这个存储库设置,有38个高分辨率的大脑。没有人会把这个大数据,但是我们对我们的模型提出了一些解决方案,我们可以使用。所以我认为我们最好。

我们把其中的一部分大脑,训练我们的模型,然后把那些我们没有考虑第一轮,我们如何评估预测。这些是我们的结果。高越好。这是一个特定的指数,神经科学家使用称为骰子指数,但它本质上是多少您的解决方案重叠使用正确的解决方案。

所以在蓝色是我们的算法。我们得到约80%的重叠白质和灰质。有趣的是,其他算法非常喜欢白质缺省情况下,我们看到的结果,但我们做得更好在物质类型,特别是灰质,能够预测的事情。

我将返回到原始图像,显示在两个相互竞争的方法填写一些随机噪声,你可以看到我们的模型并没有这样做。对吧?保持这个畸形的形象,它能够模拟原始图像不做任何形式的变形。所以它能够处理噪声,但无论是噪声或信号,它不想做一个假设,和它能够模型这些依赖项。所以你看不到随机斑点在这个形象。你看到连续,连续的白质和灰质区域。

有许多其他的结果,但这是我想讲的主要结果。所以任何问题吗?是的,文斯。

文斯:在阿尔茨海默氏症,似乎事情像手指一样的结构是一个可能的诊断。

阿米特索尼:是的。

文斯:它看起来像你的方法填写那些像手指一样的结构。是你想到的吗?

阿米特索尼:是的。这是我们思考。这么晚在阿尔茨海默氏症,我们确实看到白质变性。这是一个很好的迹象。我们确实有一些偏见的平滑,我们后续的方向。不幸的是,克里斯……幸运的是克里斯,他毕业。对我来说不幸的是,他毕业。所以我们无法跟进这些方向。

我们做的一件事是,我们使用的距离当前体素大脑的中心,我认为这可能是过度平滑的事情。但它确实帮助将白质是靠近中心,并向外灰质。所以我认为我们想要一些更细微的细节。

这是第一个节点的应用条件随机域的大脑图像。他们主要使用,实际上,文献分析,分析自然语言。克里斯做了很多伟大的作品而言,能够适应这个图像分析问题集。

是的,那是夏天的第一个出生的孩子……每个悲伤的出生,我告诉克里斯,我想,“我命令你这个新兵训练营。我要训练你的图形模型,然后由你决定。”And so I wasn't expecting much, and then I came back and I looked at his results, and he's like, "I think these look good." And I was like, "Yeah, those are ... those are good." (laughs) So that was awesome. That was a great outcome for both of us.

和我们的合作者。Sriraam现在在国际单位。他在威克森林。好吧。这里几分钟谈论一些最近的工作只是为了把这个回到原来的幻灯片。

所以,最初的任务是阿尔茨海默氏症。这个结果与阿尔茨海默病无关。在报纸上我们有结果显示,我们可以概括在两个不同的种群。所以我们使用,作为一个代理说我们可以概括阿尔茨海默氏症,但是我们不能确认准确。但是我们想返回这原始的问题。

在文献中我们发现的问题,第二个问题,我们发现在文献中——是一个很多的论文只有病人之间的诊断阿尔茨海默氏症或他们是正常的。问题是阿尔茨海默氏症是一个谱系。所以他们采取最极端的例子的两端,得到95%的准确率。但这是一个非常简单的问题。我们想看到的是能够预测中间,所以整个光谱的阿尔茨海默氏症。

另一件事是,很多这些算法简化计算的目的不是因为他们懒的问题计算的原因,而是因为你需要这百万像素点打破成…进入更大的块。所以我们认为很多信息的流失过程。我们已经表明,这是第一部分的一种方式,他们失去了信息,但他们也做其他类型的划分,简化问题。

所以我们的目标是,我们想开发一个算法,持续整个频谱,我们也希望能够做一个纵向分析。我们有这些数据,我们有病人的时间点为零,而且五年之后会发生什么,所以如果有人健康时间点零,我们想知道如果我们能预测在5年内是否会患阿尔茨海默症(老年痴呆)。

的最后一件事是,我们不想简化数据。我们希望能够从原始数据中学习。的前两个部分的主题是我不在乎的计算复杂性。好吧,我做的,但我想解决它,而不是简化问题。

如此大的新的希望进入人工智能在过去的几年里是学习深度。我有一个很好的机会在休假和丽莎和丰富的教学研讨会。很好,你知道,我们有大的班级规模。所以我的第一次研讨会是休假的时候。但我们可以手拿一群非常聪明的高级学生,我真的很想学习这个新领域,这是一个非常富有成果的研讨会,我们不得不工作和理解的细节。

因为我缺少时间,我只是手波。但一般的想法是,他们真的为几乎所有设置基准图像分析技术,和关键的想法是它能够从原始数据中学习,学会从大量的数据。

神经网络在生理上的启发。索赔是模仿人类的学习。所以专门出版的神经网络,我们可以使用原始数据是我们可以考虑人类如何看一个图像。当我们初始化一些,我在这里的抽象,所以认知科学家现在可以把他们的耳朵。但我们不要看东西,马上说它是一只狗。我们有不同层次的大脑处理图像。所以也许我们做一些低级的分析对比或在这些图像,边缘检测和我们开始构建更高层次的概念,如形状。然后这些形状形成对象等等。

所以我们看到,在神经网络,它能够做到这一点。很难看到,但在神经网络,它的许多层在一起,这就是为什么它被称为深,一个接一个的许多层。这些初始层只是学习的斑点,但是他们看起来像特性或边缘的问题。

当我们开始看到的第二个层次,每一个部分的网络学习不同的东西。所以有些学习鼻子,有些学习的眼睛,有些学习微笑,等等。然后我们去最后几层,我们可以看到,他们学到的不同类型的面孔。所以每一层是学习在更高层次的抽象。

的原因,这是大问题,我感兴趣的是我们可以把前几层,将它们应用到任何问题吗?也许这是训练面临或可能是训练有素的狗的图片,但是我们可以用它来解决问题,脑成像或其他相关问题。

Razi Shaban做了一些很酷的实验在我们的研讨会上,他谈到泛化。这是一个学校的形象。和我把神经网络,训练它只能在一个类型的东西,我想知道如何解读一个图像。所以他所做的是他训练高图像。这是他训练神经网络的图像,他想看看他的神经网络解释原始图像。所以它是一种逆向工程的事。所以restylized图像。

我认为这是一个贾斯培尔,它这个很酷的…有小梦想所有图片很酷,但基础科学的关于这些网络在做什么。

如果我有这些结果一个星期前,我可能会有更多的幻灯片,但是一个星期前,我们有结果。我们一直在努力。我们触及路障。我们是与当前的方法相当,但昨晚我收到一封电子邮件从一个以前的学生,阿里,谁是被堵在这个问题。他是一个伟大的学生。喜欢,我很幸运,他对这个项目很感兴趣。他告诉我他有高达88%的准确率,比任何其他约10%。我拍一封电子邮件回他,我一直在刷新浏览器整天希望他会给我回信,但是他还没有。

因为这是非常激动人心的。我们知道我们有一些路障。所有方法假设您正在使用的二维图像,所以我们想处理时达到资源限制大脑三维图像。是的。

如此之大的学生,所有的工作:安德里亚·马特奥在夏季工作。克里斯是第一个找到我想了解深度学习,如果他没有,事后来看,我们做了很多不好的事情,因为我们没有真正理解文献在说什么,但是那种推,球滚动。

阿里,再毕业,但是,他在[听不清00:55:57]在哈佛医学院,在实验室工作。原因他给我邮件在[听不清00:56:02]他确实是一个朝九晚五的工作,那么这是否有趣。那太好了。对吧?所以他一直很堵,我真的很想知道我们可以把它的地方。

最酷的地方,网络是训练有素的谷歌图片搜索的图像。这只是训练,人类和狗的照片。如果你拿走的,解决方法是更糟。这是很酷的,这种神经网络能够模拟线路从成千上万的图像,我们每天都能看到世界上能够更好地了解大脑。

我低。有其他项目,我的工作,我将在今年夏天与转录因子预测,应用深度学习。所以Raehoon和詹姆斯一直和我在一起工作。我要有几个学生和我今年夏天工作。

我休假研究是在一个非常不同的方式思考图形模型,所以取消所谓的一阶逻辑。的主要思想有更表达但计算昂贵得多。所以我们做了……我们有几个文件与文本分析出来,我们只接受一个AI医学杂志的一篇论文为能够诊断帕金森病。

主要的思想是我们想去异构模型的这个想法。在模型之前会说,让我们一块数据,学习模型,并预测,所以许多遗传信息。但是这些新模型需要考虑结合多个模式。医生指出,遗传、脑成像血液工作,我们不得不面对这样一个事实,一些患者从来没有在去完成他们的血液工作,或看到有人和我一样,喜欢,四个不同的医生还是有人喜欢我的妻子从来没有去看医生,因为她总是健康。我们有不同类型的人的不同类型的信息。

这个工作是我与一群印第安纳大学。我们有一些很棒的结果的,我很乐意跟你离线。

所以我的高度总结,大数据的趋势需要新方法>问题的图形化模型是一个大道接近处理噪声和结构。深度学习是令人兴奋的新东西出来……持有的承诺由于并行性和能够处理大量的数据特性的工程。我很好奇未来是什么,我认为这可能是所有这些东西的组合。我不认为这只是一个。所以有很多很酷的工作在深度学习与图形相结合的模型,我希望今年夏天参与。

所以,谢谢你。这是一个美好的休假;我能做许多很酷的事情。我能够主持我最好的朋友和他的搭档之间的婚礼,这是一个伟大的经验。我失去了浴缸里辩论,因为选举存在舞弊现象。这是他们总是想出一些荒谬的场景,像什么世界即将结束。假的场景是唐纳德·特朗普赢得了选举。(笑)所以,回家离家近一点。我能去巴塞罗那的一个小婴儿月亮和我的妻子,我们也欢迎我们的第二个孩子。这是一个伟大的休假。 But technically it was after sabbatical, so I guess that ... thank you for paternity leave [crosstalk 00:58:53]. Any questions? (applause)

欢迎提交

通信办公室邀请斯沃斯莫尔社区的所有成员分享视频、照片、故事和创意最佳线上娱乐学院的网站。你看过新闻的明矾吗?请让我们知道通过编写news@最佳线上娱乐swarthmore.edu

Baidu
map