麻省理工学院称第三方 Twitter 机器人检测工具“不准确”:数据集过于简单,泛用性较差

玩物志 20230626

  • 机器学习
  • 社交媒体
  • 机器人检测

   美国麻省理工学院(MIT)的研究团队近日发表论文指出,现有的第三方推特(Twitter)机器人账户自动检测工具并不准确,因为其数据集过于简单,缺乏泛用性。

 

  此前有消息称,机器人账户过多是阻止马斯克收购推特的原因之一。推特当时声称其日活跃用户中有5%是机器人账户,但马斯克表示这个数字要比5%高得多。

 

  推特有自己的机器人账户识别系统,但并未公开。因此,对于普通公众而言,第三方工具是较为可行的检测方法。这些第三方工具使用从推特收集的数据集和机器学习模型来检测机器人的可疑迹象,许多工具和模型已被用于研究社交媒体上的机器人活动,相关论文甚至已达数千篇。



▲用于推特机器人检测的公开基准数据集

 

  这些论文中的大多数基准数据集都是在不同推文中收集的数据集合,其中许多都是在特定推文(例如包含特定主题标签的推文)中收集的,每条都由人类手动标记为机器人或人类。然而这种经过专门训练的机器人检测模型在该专业领域表现出色,却并没有涵盖全部领域,并且严重依赖于特定数据,而不是机器人和人类之间的根本差异。

 

  当这些模型在其他领域的数据集上进行测试时,它们的准确性很差,几乎与随机预测水平相当。同时,在许多数据集上,即使是相对简单的模型也与最先进的机器学习模型(SOTA)准确率相当。

 

  换言之,在一个数据集上训练的模型不能推广到其他数据集,现有的机器人检测数据集由于数据收集简单而通用性较低。

 

  最后,研究人员警告说,当使用现有的机器人检测数据集时,用户应该仔细考虑可能存在哪些类型的偏差。研究人员认为,一个根本的解决方案是推特等社交媒体本身就应该为研究人员提供丰富、可靠的数据以及高质量的真实标签。

查看全文

点赞

玩物志

作者最近更新

  • 想实现自动驾驶 , 哪些技术非常关键?
    玩物志
    5天前
  • 又一传感器企业即将登陆北交所!供货吉利、奇瑞、长安汽车
    玩物志
    6天前
  • 自动驾驶黑马再获巨额融资!到2026年将部署5000台无人配送车
    玩物志
    08-23 13:59

期刊订阅

相关推荐

  • 据报告,2024年人工智能在全球物联网市场中规模将达162亿美元

    2019-04-16

  • 无创脑机接口效果已接近脑部植入传感器

    2019-07-05

  • 新型设备用生物传感器预测个体癌症患者的化疗有效性

    2019-07-26

  • 传感器的机器学习

    2019-08-30

评论0条评论

×
私信给玩物志

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告