Nov, 2023

Gendec: 基于机器学习的从日本人姓名检测性别的框架

TL;DR通过对日本名字的分析,本研究提出了一种可以准确检测日本名字的性别的方法,并且构建了一个包含难读、平假名和汉字形式的 64139 个名字及其生物性别的数据集。通过这个新的框架,可以从名字中预测性别,解锁与语言模式和文化规范相关的有价值的信息。