- 关于机器学习数据质量维度与工具的调研
机器学习中数据质量评估工具的回顾与比较,提出了开源数据质量工具发展的路线图,并探讨了大型语言模型和生成式人工智能在数据质量评估和改进中的潜在应用。
- 无光谱的星系光谱学:条件扩散模型解读光度图像中的星系属性
开发了一种能够从光度宽频带图像中预测光学星系光谱的生成式人工智能方法,并通过与观测光谱的对比显示了良好的一致性,该方法还能推断光度图像中的速度色散和活跃星系核的存在,并可以在大规模光度调查中获得科学上有趣的星系属性。
- 多步骤的无结构数据知识检索与推理
通过整合精细调整的大型语言模型与具有逻辑推理、规划和交互式约束求解能力的强大符号推理引擎,本研究介绍了 Cora,一个基于神经符号人工智能平台构建的协作研究助手,该助手旨在高风险领域执行复杂的研究和探索任务。本研究讨论了此类领域中的多步推理 - 改革软件开发:评估 GitHub Copilot 在现实项目中的效率和挑战
Generative AI technologies promise to transform the product development lifecycle, and this study evaluates the efficien - 走向科学的外脑
人工智能方法将革新知识工作,生成式人工智能实现了文本分析、文本生成和简单的决策或推理的自动化。我们回顾了代理人工智能系统的现状,并讨论了如何进一步将这些方法扩展到科学研究中。我们提出开发外在皮层的构想,即人工合成的人类认知扩展。科学外在皮层 - 迈向更公平的人脸识别数据集
利用生成的训练数据集中的人口属性平衡机制,提出了一种全面的评估方法,旨在促进更公平、透明的人脸识别和验证,并发现在减少人口属性不公平的同时,性能差距仍然存在。
- CVPR避免生成式 AI 模型中有害医疗产品推荐和非标示推广的保障措施
通过提出一种方法识别潜在有害的产品推荐,我们展示了一个基于最近的多模态大型语言模型的研究。
- 利用自相似性作为注意力机制生成具有结构的音乐
我们提出了一种注意力层的方法,使用用户提供的自相似矩阵来在生成音乐时添加模板结构,并通过与没有注意力机制的模型进行比较,证明了该方法显著提高了网络的特定结构复制能力,以及在未见测试集上的性能。
- 基于击键动态的抵制学术不诚实行为在 LLM 时代的应用
该研究提出了一种基于击键动态的方法,以区分学术环境中真实和辅助写作,并利用改进的 TypeNet 架构训练检测器。研究结果突显了真实和辅助写作之间击键动态的显著差异,并对提高数字教育平台的可靠性产生影响。
- 图像导体:交互式视频合成的精准控制
提出了一种从单张图像生成视频资产的方法,通过 Image Conductor 实现了摄像机转换和物体移动的精确控制,并通过训练策略、引导技术和数据处理流程进一步改进,展示了在交互式视频合成中实现精准控制的效果。
- 自动诗歌生成中的多样性评估
评估自动生成诗歌的多样性,通过比较自动生成诗歌的结构、词汇、语义和风格等维度的分布与人类诗歌的分布,并考察不同模型类型和微调类型,发现当前的自动生成诗歌系统在多个维度上缺乏多样性,但风格条件和字符级建模明显增加了多样性。这些限制可用于更加多 - 一种评估生成型人工智能思考质量的框架
通过 MAGE 框架,本研究旨在探索 LLM ChatGPT4 应用的能力,为教育工作者提供一个方法,以在其学科背景中系统地评估其评估的脆弱性,并提供特定和针对性的问题脆弱性指示,以评估关键思维技能的基础。
- 生成人工智能引导的用户研究:应用于空中出租车服务
利用大型语言模型(LLM)创建产生式人工智能虚拟场景,通过招募真实用户评估体验,收集反馈以便在早期设计阶段进行快速迭代,本研究以空中出租车为案例研究,使用 OpenAI 的 GPT-4 模型和人工智能图像、视频生成器设计了虚拟空中出租车,经 - HoLLMwood: 大型语言模型通过角色扮演释放剧本创作的创造力
HoLLMwood 是一个自动化框架,通过将大型语言模型分配到不同的角色,包括作家、编辑和演员,来释放它们的创造力并探索其在编剧方面的潜力,研究结果表明 HoLLMwood 在连贯性、相关性、趣味性和整体质量方面明显优于强基准。
- 高效生成人工智能:人与算法的半人马
高级分析科学方法使得人工智能和人类智慧的力量相结合,创造了 “半人马”,从而实现了更优越的决策。这项工作旨在回答如何将半人马与传统人类与 AI 模型区分开来、创建半人马最有效的方法、何时使用半人马以及何时使用传统 AI 模型等基本问题,并以 - 大型语言模型在混合策略纳什均衡游戏中的应用
本研究旨在研究博弈论和生成人工智能的交叉领域,聚焦于大型语言模型在找到混合策略 Nash 均衡的游戏中的能力,发现了大型语言模型在运行代码和提供特定提示的情况下性能显著提高,但也揭示了在难以推断游戏的随机化策略时,大型语言模型的限制性。该论 - 医疗健康中生成人工智能的应用:算法、伦理、法律和社会考虑
该研究针对生成式人工智能应用于医学成像和文本分析时带来的伦理问题、法律问题和算法挑战进行了深入研究,并提出了负责任的解决方案和强有力的监管框架,以确保生成式人工智能在医疗领域的道德和负责任的实施。
- 基于上下文无关文法的领域特定速记生成
我们介绍了一种基于上下文无关文法(CFG)的特定领域速记(DSS)格式,用于减少生成结构化数据所需的标记数量,并将其应用于使用 LLMs 进行数据可视化的情况,以实现生成的标记数量的显著降低(3 倍至 5 倍),从而大大降低延迟和成本。
- 现实世界中的实时深伪检测
该研究论文介绍了 “局部感知深度伪造检测算法”(LaDeDa),该算法使用单个 9x9 图像块作为输入,并输出其深度伪造得分。利用图像块级别的信息,LaDeDa 显著提高了检测的准确性,在当前基准测试中达到了约 99% 的平均准确率。此外, - 微调的「小型」LLM 在文本分类中仍显著优于零样本生成式 AI 模型
通过比较生成型 AI 模型和经过细调的 LLMs,在文本分类任务中,利用应用特定训练数据进行细调的模型表现优异,从而验证了生成型 AI 模型在兑现其承诺方面存在问题。