- HAIChart:人工智能协作可视化系统
关键字:数据可视化,商业智能,自动化工具,用户反馈,HAIChart。总结:本文介绍了 HAIChart,一种基于强化学习的框架,通过结合用户反馈,迭代地为给定数据集推荐好的可视化。通过量化评估和用户研究,表明 HAIChart 在召回率方 - 使用函数数据分析进行噪声数据可视化
数据可视化通过降维是探索性数据分析中的重要工具,本文提出了一种新的数据可视化方法叫做功能信息几何(FIG),该方法结合了经验内在几何(EIG)框架和功能数据分析,以解决维度灾难问题,并在捕捉真实结构、超参数稳健性和计算速度方面优于 EIG - 大型视觉语言模型对图表理解和推理的挑战:LVLM 的能力与限制的广泛调查
本研究通过对大型视觉语言模型(LVLMs)的全面评估,揭示了它们在图表理解和推理任务中的优势和局限性,并提供了未来研究的启示。
- 如何整合云服务、数据分析和机器学习技术以降低与现代云基础设施相关的网络风险
本文研究了云技术、机器学习和数据可视化方法的结合,展示了如何整合云服务、数据分析和机器学习技术以便检测和减少与现代基于云的基础设施相关的网络安全风险。通过应用机器学习监督分类器设计了一个基于著名的 UNSW-NB15 数据集的模型,预测网络 - ChatGPT 在数据可视化教育中的应用:学生视角
探讨大型语言模型驱动的聊天机器人对学生学习的影响,并就教育解决方案的设计考虑进行讨论,特别针对数据可视化教育。
- CNN 网络数据领域变化的可视化方法及分类任务阈值选择的优化方法
通过可视化方法来直观反映模型的训练结果,并展示数据增强技术对跨领域 Face Anti-Spoofing 任务的有效性,同时基于训练数据集的分布提出了一种设置阈值的方法。最终在两个竞赛中获得了第二名。
- 利用方向感知的 t-SNE 可视化高维时序数据
我们提出了两个互补的、方向感知的损失项,用于优化 t-SNE 的目标函数,强调数据的时间属性,指导优化和生成的嵌入结果,以显示出可能被忽略的时间模式。通过促进定向边的局部方向性,我们的方法产生了更具有时间意义且不那么混乱的可视化结果。
- 曲率增强的流形嵌入和学习
提出了一种新的降维和数据可视化方法,称为曲率增强流形嵌入与学习(CAMEL)。该方法通过使用节点之间的力场来寻找数据集的 n 维流形表示,包括一个新的力场模型以及用于无监督学习、有监督学习和半监督学习的 CAMEL 公式。应用于多个基准数据 - 从像素到洞见:大型基础模型时代的自动图表理解综述
数据可视化是数据分析中至关重要的一环,自然语言处理中的大型基础模型在图表理解任务中发挥了重要作用。本综述论文全面概述了在大型基础模型背景下图表理解的最新发展、挑战和未来方向,包括问题界定、任务和数据集、建模策略以及性能改进等内容。
- 图表智能分析:优化图表概述的上下文思维方法
数据可视化是呈现数据和挖掘其有价值洞见的关键手段。通过自然语言处理技术,图表总结任务促进了对图表的深入数据分析。本研究构建了一个大规模的全面图表 - 标题数据集,提供了每个图表的微调指导,以解决现有方法在视觉 - 语言匹配和推理能力方面存在 - 随机森林和过拟合的理解:可视化和仿真研究
随机森林被用于临床风险预测模型,本研究以卵巢恶性肿瘤预测为案例,通过三个真实案例和一个模拟研究,通过二维分布热图和训练数据的概率峰值将风险估计进行可视化,模拟研究结果表明随机森林模型学习到训练集中的概率峰值,训练集上的 c-statisti - Prompt4Vis: 利用示例挖掘和模式过滤为表格数据可视化的大型语言模型提供提示
Prompt4Vis 是一种利用大型语言模型和上下文学习来增强从自然语言生成数据可视化查询的性能的新型框架,通过在 NVBench 数据集上进行广泛实验,明显优于最先进的 RGVisNet 约 35.9% 和 71.3%。
- ChartAssisstant:通过图表 - 表格预训练和多任务指导调优的通用图表多模态语言模型
通过 ChartAssistant 这一基于图表的视觉语言模型,本研究提出了一种解决图表理解的通用模型,经实验证明在各种图表任务上取得了显著性能提升。
- 量子核 t 分布随机邻居嵌入
量子数据可视化方法使用量子核心技术,能够快速准确地可视化量子状态,并成功发现受激截面伊辛模型的优化轨迹特征。
- 流形学习:是什么,怎么做,为什么
Manifold learning is a set of methods to find the low dimensional structure of data, allowing visualization, de-noising, - 数值属性的离散化:人类感知的分析
本研究通过收集人类和数据科学、统计学以及工程专家的反馈,分析了数值属性的分割,提出了两种度量方法,结果显示约 68.7% 的人类反馈与我们的度量方法一致,因此我们的度量方法可作为一种用于数值属性离散化的方法之一。
- EMNLPLLM4Vis:使用 ChatGPT 进行解释性可视化推荐
LLM4Vis 是一个基于 ChatGPT 的提示方法,可执行可视化推荐,并使用极少数量的演示示例返回类人的解释,通过考虑先前生成的解释和基于模板的提示进行迭代性微调生成的解释。在 VizML 数据集上的评估表明,LLM4Vis 在少量示例 - 利用 nvBench 数据集的数据可视化自然语言模型
我们探索了使用大型语言模型(如 BERT)作为编码器,基于序列到序列变压器的机器学习模型架构,从自然语言查询中预测可视化命令,并应用可用的 T5 序列到序列模型进行比较。
- 中文自然语言问题的自动数据可视化生成
数据可视化已成为从大规模数据集中获取洞察力的有效工具。本研究提出了一种中文文本到可视化的数据集,并展示了我们对该问题的首次尝试。我们的模型集成了多语言 BERT 作为编码器,增强了跨语言能力,并将 $n$-gram 信息融入我们的词表示学习 - 将对话系统与数据可视化相结合:从自然语言对话中生成交互式数据可视化
通过使用对话方式构建数据可视化,本研究提出了一种名为 CoVis 的新任务,并通过使用多模态神经网络 MMCoVisNet 来回答与数据可视化相关的查询,实验证明 MMCoVisNet 优于现有基准并达到了最先进的性能。