- 卷积神经网络中单词识别的神经编码破解
通过训练深度神经网络模型来识别书面文字,并分析阅读专门化单元在网络的不同层次中是如何出现和运作的,我们揭示了这些单元敏感具体的字母身份和它们距离单词左侧或右侧的空格的距离,从而充当 “空格二元组”。这些单元特定地编码序数位置,通过从网络的早 - 听觉词汇识别与整合的神经动力学
本文报道了一种基于贝叶斯决策理论的语音识别计算模型,并通过 EEG 信号记录揭示了字词识别和整合的神经相关性,支持了语音理解的两个部分模型。
- 成人如何理解幼儿的话语
该研究使用贝叶斯框架对儿童早期语言发展进行建模并发现了成年人解释孩子的讯息所需的先验信息的影响,这点揭示了成年认知处理在支持儿童早期沟通方面的关键作用。
- 利用视觉基础的语音建模词汇学习和识别
该研究使用视觉以及语音的统计依赖关系进行词语识别,并探究其中的单复数形式和词汇竞争效应,同时研究了矢量量化在识别词语方面是否有益。
- 使用语音到图像检索的语言学习
本研究提出了一种改进的神经网络方法,借助多层 GRU、重要性采样、循环学习率、向量自我注意力等结构,实现了从口语训练中创建基于视觉的句子嵌入,相比较前人工作取得了显著提升的图像字幕检索性能,并且揭示了模型的哪些层更适合识别输入中的单词。
- 基于视觉的子词语音单元发现探索
研究了如何使用卷积神经网络模型来关联原始语音波形和自然图像场景,探究了解释性的子词语音单位是如何出现的,可以深层次地理解中间层的激活模式,揭示出 Diphone 边界被表浅提取,表明对于字词的识别中该模型在利用这些事件,并提出了多个实验来研 - 生成文本识别的合成数据
本研究使用开源字体和数据增广技术生成 900 万份手写词图像,可用于训练深度神经网络并提高手写词识别的性能。
- 基于半字符的循环神经网络实现鲁棒性词语识别
本研究提出一种半字符级递归神经网络模型,用于识别单词拼写错误,与现有的拼写检查器和基于字符的卷积神经网络相比,具有更为强大和鲁棒的性能,可以模拟人类阅读难度的实验。
- 无约束文本识别的深度结构化输出学习
本研究提出一种基于卷积神经网络和条件随机场的模型,通过预测字符和 N-grams 以识别自然图像中词语,同时实现多任务学习,无需有固定的单词列表,实验证明其在标准实际文本识别基准中的准确性优于仅预测字符,也达到了有限词汇识别的最高精度。
- 使用卷积神经网络从自然场景中读取文本
本研究介绍了一种基于卷积神经网络的端到端文本识别、图像检索系统,使用了一些新颖的深度学习技术实现文本定位、识别、筛选和排序,在多个基准测试数据集上获得了最先进的性能表现,并应用于新闻视频检索中。