BriefGPT.xyz
大模型
Ask
alpha
关键词
t5 architecture
搜索结果 - 2
多层次多模态 Transformer 用于多页文档问答任务
本研究扩展了针对单页文档的 DocVQA 任务到多页文档的场景,提出了一个基于 T5 架构的新的分层方法 Hi-VT5,用于处理长的多页文档,并且通过实验证明本方法可以在单阶段完成回答问题和提供包含答案相关信息的页码,该信息可以作为可解释性
→
PDF
2 years ago
HaT5: 使用文本转换转换器进行仇恨语言识别
本研究使用 T5 架构及自回归模型对包含 5 个不同任务的 2 个数据集进行性能比较与错误分析,提出了一种新的数据增强方法以及训练方法并通过解释性人工智能算法提高了预测准确率。
PDF
2 years ago
Prev
Next