Nature:用机器学习算法揭示的大脑动态
2023/6/2 17:14:10 阅读:103 发布者:
论文ID
题目:Learnable latent embeddings for joint behavioural and neural analysis
期刊:Nature
IF:69.504
发表时间:2023年5月3日
通讯作者单位:洛桑联邦理工学院
DOI:https://doi.org/10.1038/s41586-023-06031-6
主要内容:
CEBRA是一种机器学习方法,可用于压缩时间序列,以揭示数据可变性中原本隐藏的结构。它擅长处理同时记录的行为和神经数据,它可以对小鼠大脑视觉皮层的活动进行解码,以重建观看的视频。
现代神经科学研究使数据收集的速度越来越快,了解构成神经系统的复杂非线性系统的能力仍然有限。直到最近,神经科学家们才能够记录大规模的行为和神经活动。然而,一直缺乏联合考虑这些数据的工具。此外,机器学习技术已经取得了巨大的进步,但关于如何分析现实世界的连续和离散时间序列数据的问题仍然存在。因此,迫切需要创新的计算工具来理解可以观察到的信息(尽管仍然有限)和科学家想要了解的隐藏动态之间的复杂关系。
为了解决这个问题,作者进行了一项计算研究,以开发一种理论上有保证的算法,使作者能够估计支撑神经数据的潜在(隐藏)因素。作者概括了一种机器学习技术,基于所谓的对比学习,学习高维数据如何在低维空间(称为潜空间)中排列(嵌入),从而使相似的数据点靠近,而更多不同的数据点相距更远。这个空间中的嵌入可以用来推断数据中的潜在关系和结构。作者将这种对比学习方法扩展到带有离散或连续 "标签 "的样本数据。这些标签可以是在同一时间收集的其他数据,或者只是时间本身(图1)。因此,作者引入了三种对比学习的变体:有监督的(使用用户定义的注释)、自我监督的(只使用时间标签)和混合变体。对比学习的优势在于它能够共同考虑神经数据和行为标签:这些标签可以是测量的动作、抽象的标签(如 "奖励")或解构的感官特征(如图像的颜色或纹理)。CEBRA的一个主要特点是鼓励用户首先使用自我监督学习(发现驱动的科学),然后用标签做监督学习(假设测试),以了解什么有助于嵌入。如果标签在潜伏空间中没有体现,就不会发现任何结构。
作者的方法在恢复地面真实数据方面的表现大大优于其他降维算法,如t-SNE、UMAP和变异自动编码器。作者进行了几项神经科学分析,以突出CEBRA在生命科学领域的应用。首先,作者在使用两种技术记录的神经数据中发现了高度相似的潜在结构,解决了一个关于用不同方法收集的数据的可比性的重要开放问题。其次,作者使用CEBRA对小鼠观看视频时在一个叫做视觉皮层的大脑区域记录的活动进行解码,从而实现了对该视频的高性能解码。这表明,即使是初级视觉皮层(通常被认为只是相对基本的视觉处理的基础)也可以被用来进行脑机接口式的视频解码。
作者介绍的方法并不限于神经科学。许多数据集涉及时间或联合信息,CEBRA可用于其他降维工具(如UMAP或t-SNE)的情况,并可从明确使用时间中受益。作者设想,这项技术可以用于研究发展、动物行为和基因表达数据。CEBRA的优势之一是它可以结合不同模式的数据,并有助于限制细微差别(如数据的变化取决于数据的收集方式)。
所有的工具都有其局限性。当有足够的观察数据时,CEBRA会很出色,但当数据点太少时(例如,来自太少的神经元),嵌入结构和解码会受到影响。如果有的话,可以合并数据集,以增加用于训练CEBRA神经网络的观测数据的数量。
一个明显的下一步是将CEBRA整合到脑机接口,以建立强大的潜伏嵌入,用所需的硬件进行高性能解码。作者的工作只是朝着开发神经技术中所需要的理论上认可的算法迈出了一步。
原文链接:https://www.nature.com/articles/s41586-023-06031-6
转自:“生物医学科研之家”微信公众号
如有侵权,请联系本站删除!