- 朴素贝叶斯和随机森林用于农作物产量预测
本研究分析了 1997 年至 2020 年期间印度的作物产量预测,重点关注各种作物和关键环境因素。利用线性回归、决策树、KNN、朴素贝叶斯、K 均值聚类和随机森林等先进的机器学习技术来预测农业产量。尤其是朴素贝叶斯和随机森林模型通过数据可视 - 卷积神经网络能够实现二元保释判断分类
本研究旨在利用卷积神经网络(CNN)架构处理一组印地语法律文件,并在保释预测任务中利用 CNN 模型,取得了 93% 的整体准确率,相较于印度北方邦 20 个地区的基准准确率有所增长。
- 揭示公众感知:基于机器学习的印度 COVID-19 疫苗情感分析
通过数据挖掘技术,分析 Reddit 数据并评估印度人对 COVID-19 疫苗的情感。结果显示,大多数印度 Reddit 用户对疫苗持中立态度,给印度政府在努力为人口大量接种疫苗带来了挑战。
- 使用 ChatGPT 的多语言旅游协助:比较印地语、泰卢固语和卡纳达语的能力
该研究调查了 OpenAI 的 AI 语言模型 ChatGPT 在将英语翻译成印地语、泰卢固语和卡纳达语方面的效果,旨在帮助在印度多元文化环境下的游客。研究中使用了一个包含 50 个问题的测试集,涵盖了常识、食物和旅行等不同领域,这些问题由 - IndicTrans2:适用于所有 22 个印度预定语言的高质量可访问机器翻译模型
该研究旨在通过整合并创建特定于印度的并行语料库和基准测试数据,训练出支持所有 22 种印度语言的机器翻译模型,为印度的语言多样性提供广泛且易于访问的机器翻译系统,该研究创造性地提出了四个关键领域的改进,并发布了 BPCC 和 IndicTr - PMIndiaSum: 面向印度的多语和跨语言头条摘要
本文介绍了 PMIndiaSum,一个针对印度语言的多语言和大规模并行的标题摘要语料库,并为单语、跨语言和多语言摘要提供了基准和数据测试。
- IJCAI为印度农村滞后地区的贫困估计和生计能力学习和推理多方面和长期数据
本文旨在研究 1990-2022 年间印度农村地区的贫困情况,使用生活质量和生计指标将地区分为 “先进”、“赶超”、“落后” 和 “滞后”,整合各种数据来源分析贫困情况,尤其针对性地关注弱势人群以减少不平等现象。
- ICLRSynthpop++: 一个生成国家级合成人口的混合框架
该研究介绍了一种新型的混合框架 SynthPop++,该框架可以将来自多个现实调查的数据(具有不同且部分重叠的属性集)组合起来,生成具有真实比例的合成人口,该方法可以用于在印度进行感染病例的代理建模。实验结果表明,我们的合成人口可以在城市、 - 印度议会讨论什么?洛克・萨巴问政时间的探索性分析
本文介绍了 TCPD-IPD 数据集,该数据集是印度议会下议院 1999 年至 2019 年议会问询时间讨论的问题和答案的集合,使用文本分析工具对数据集进行了探索性分析,通过动态主题模型来理解议会讨论的时期性变化以及政治经济紧张局势的相关表 - 人们如何在 Twitter 上回应 COVID-19 大流行病:美国和印度情绪表达的比较分析
研究探讨了美国和印度在 2020 年 2 月至 2021 年 4 月的十五个月中通过超过 5400 万条推特表达的与 COVID-19 相关的各种情绪,应用预训练的情感分析和主题建模算法,研究了四种不同类型的情绪(恐惧、愤怒、快乐和悲伤)及 - PACO:行动、文化和压迫相关挑衅
本研究旨在通过使用 PACO 数据集训练 fine-tuned RoBERTa 模型,自动识别 WhatsApp 帖子中的挑衅句子,以避免情绪化文字对目标宗教群体的歧视或暴力。研究还通过识别针对宗教群体使用的对话交际行为和不礼貌策略,从语用 - 规模化预测结核病患者的治疗依从性
利用近 70 万份印度四个州的病人资料,使用机器学习技术通过自定义排名指标并考虑到国家范围内的大规模未来部署,可以实现早期预测不依从医嘱的非依从性患者的风险分层,是一种可行的落地的机器学习解决方案。
- ACLNLP 中的公正性再概念化:以印度为例
本文旨在研究印度社会准则在 NLP 的公正性中的作用,通过对印度社会背景、资源以及文化价值观的分析,建立公正性评估模型,探讨预测偏见和社会刻板印象的存在,并提出改进 NLP 公正性的全面研究议程,为其他地缘文化背景的研究提供借鉴。
- 在 XAI 中借鉴南半球背景下的可解释性
该研究提出了建立在社会背景和社技术系统中的关于 AI 可解释性的理解,将这个理解放在全球南方和印度的背景下,并表示需要更多的全球南方的研究以提高可解释性和 AI 的水平。
- 非计划和濒危印度语言的语言资源和技术
对印度非计划和濒危语言可用的语言资源和技术进行了调查,发现除了《印度宪法》规定的 22 种语言(称为计划语言)之外,几乎没有实质性的资源或技术可用,该研究概述了印度宪法第 8 编排除的印地语以外的印度语言和濒危语言的语言资源和技术。
- 利用计算机视觉进行香蕉亚科分类和质量预测
本文介绍了基于计算机视觉技术的香蕉分类模型,可用于实现准确的香蕉品种识别和质量检测,从而帮助提高库存管理自动化和减轻手工劳动强度。经过对 3064 张香蕉图片数据集的训练,模型在香蕉品种和质量检测方面的准确性分别达到 93.4% 和 100 - 印度大选推文情感分析与讽刺检测
本文使用 Transfer Learning 和 TF-IDF 技术以及 Linear Support Vector 分类器方法构建了自动推文分析器,以分析 2019 年印度选举期间人们的情感倾向和观点,进一步处理了原先未被考虑到的用户发布 - KDD在人道主义地图绘制中评估机器学习的公正性
通过使用机器学习和卫星技术进行人道主义地图制作可以及时准确地识别需要帮助的人群,但是从空间进行人道主义制图的算法决策公平性和透明度的问题是这些方法在实践中应用的一个重要障碍,本研究以印度为例通过夜间灯光数据使用线性回归和随机森林算法制图并分 - 重新构想印度及其他地区的算法公正性
本文分析了印度的 AI 力量和算法公平性,认为印度数据不稳定、机器学习开发者存在双重标准,因此在该地区只关注模型公平性是表面文章。提出了重新构想印度算法公平性的方案,重新定位数据和模型,并赋权受压迫群体,支持公正的机器学习生态系统。
- 印度和巴基斯坦社交媒体极化的计算机分析
在首次分析印度和巴基斯坦之间由 Twitter 上的偏极信息引起的紧张关系的工作中,揭示了印度统治党派(BJP)的政治家们更多地使用极化的标签和呼吁升级冲突。