EnSolver:基于深度集成的不确定性感知验证码求解器
本文讨论了使用合成训练数据来优化神经网络参数与近似贝叶斯模型的相关性,并展示了其在验证码破解等任务中的应用和成功实验结果,并在此基础上探讨了使用合成数据训练神经网络需要考虑的因素和如何确保模型的泛化能力。
Mar, 2017
本文提出了针对对比学习预训练的图像编码器的第一个成员推断方法EncoderMI。EncoderMI利用图像编码器向其训练数据的过度拟合,旨在推断输入是是否在图像编码器的训练数据集中,可用于数据所有者审核公共数据是否被授权用于预训练图像编码器,也可用于攻击者破坏私有/敏感的训练数据的隐私。通过本文,我们还探索了防止过拟合的 EncoderMI 对策,即通过提前停止防止过拟合,虽然会影响 EncoderMI 的准确性,但它将产生基于图像编码器构建的下游分类器的分类准确度损失。
Aug, 2021
本文提出了一种基于不确定性的图片字幕生成框架,通过并行迭代地从易到难插入不连续的候选单词,将高不确定性的单词在较晚阶段生成,以生成更直观、可解释的字幕。在训练中,作者利用一种基于图像的词袋模型来衡量单词的不确定性,并运用动态规划算法构建训练对。在推理中,作者提出了一种不确定性自适应的并行波束搜索技术,显著提高了推断速度和字幕生成的质量。
Nov, 2022
该研究旨在调查CAPTCHA生成系统中的缺陷和漏洞,以设计更具弹性的CAPTCHA。通过创建CapNet,我们提出了一种卷积神经网络平台,旨在评估数字和字母数字CAPTCHA,从而提高网站的安全性。
Feb, 2023
通过使用扩散模型生成图像,文中介绍了一种名为Diff-CAPTCHA的图像点击CAPTCHA方案,该方案通过减弱用于机器学习的字符特征、增加CAPTCHA中字符特征的多样性以及增加破解算法的难度,有效提高了CAPTCHA的安全性。研究还通过多种攻击方法验证了Diff-CAPTCHA的安全性,并将其与三种基准方案进行了比较,实验结果表明,扩散模型在提高CAPTCHA安全性的同时能够保持良好的人类可用性。
Aug, 2023
我们提出了一种新方法MOCHa,通过使用强化学习(RL)的进展来处理图像字幕中幻觉的序列级性质,在不需要强监督的情况下共同优化字幕的准确性和生成的内容的逻辑一致性,并展示了其在不同规模的字幕模型上的卓越性能。
Dec, 2023
通过关键词隐私、安全、深度神经语言模型、加密和性能,本文提出了一种新颖的方法来改进和优化基于Transformer的语言模型,在密钥加密的用户特定文本上进行自适应和微调,以实现在保护性能、隐私和安全性的同时进行推理和训练。
Dec, 2023
我们的项目旨在通过开发结合卷积神经网络(CNN)和编码-解码模型的自动图像字幕架构来解决图像字幕的挑战。我们还进行了性能比较,研究了多种预训练CNN模型的性能变化,并探索了频率正则化技术在压缩“AlexNet”和“EfficientNetB0”模型方面的整合,旨在在更节省资源的同时保持模型的有效性。
Apr, 2024
本研究解决了现代CAPTCHA在图像识别模型进步背景下的脆弱性。通过允许对图像进行更显著的修改,同时保持语义信息,使得人类可解答,我们能够有效欺骗多种高级模型。研究发现,使用不同强度的面具可以使模型的准确率大幅下降,显示出机器尚未完全赶上人类的能力。
Sep, 2024
本文研究了采用先进机器学习方法破解谷歌 reCAPTCHA v2 的有效性,填补了先前研究的空白。通过使用先进的 YOLO 模型进行图像分割和分类,研究表明可以100%解决这些验证码,而此前的研究仅能解决68-71%。这一发现表明,当前人工智能技术能够有效利用复杂的基于图像的验证码。
Sep, 2024