科学家重新命名人类基因 以防Excel将其误读为日期

西贝网 20200807

  • 生物医疗
  • 基因组学
在过去的一年多时间里,大约有27个人类基因被重新命名,这都是因为微软Excel一直把它们的符号误读为日期。

       人类基因组中有数以万计的基因:DNA和RNA的微不足道的扭曲,它们结合在一起,表达了使我们每个人独一无二的所有特征和特性。每个基因都有一个名称和字母数字代码,即所谓的符号,科学家用它来协调研究。但在过去的一年多时间里,大约有27个人类基因被重新命名,这都是因为微软Excel一直把它们的符号误读为日期。

       这个问题并不像最初听起来那么意外。Excel是电子表格界的庞然大物,科学家经常使用它来跟踪他们的工作,甚至进行临床试验。但它的默认设置是以更平凡的应用为目的的,所以当用户在电子表格中输入一个基因的字母数字符号时,比如MARCH1,即"膜关联环-CH型手指1 "的缩写,Excel会将其转换为日期:1-Mar(3月1日)。

       研究发现,论文中的基因数据有五分之一受到EXCEL错误影响。这是非常令人沮丧的,甚至是危险的,科学家们不得不用手整理恢复被破坏的数据。它也令人惊讶地广泛存在,甚至影响到同行评审的科学工作。2016年的一项研究检查了3597篇发表论文旁共享的基因数据,发现大约五分之一的数据受到了Excel错误影响。

       这种错误也没有简单的解决方法。Excel并没有提供关闭这种自动格式化的选项,避免这种情况的唯一方法就是改变各个列的数据类型。即使这样,科学家可能会修正自己的数据,但只要别人不假思索地在Excel中打开同样的电子表格,错误就会重新引入。

       不过,帮助已经到来了,那就是负责基因名称标准化的科学机构--HUGO基因命名委员会,即HGNC。本周,HGNC发布了新的基因命名指南,包括针对影响数据处理和检索的符号。从现在开始,人类基因和它们所表达的蛋白质在命名时将考虑Excel的自动格式化。也就是说,符号MARCH1现在变成了MARCHF1,而SEPT1变成了SEPTIN1,以此类推。HGNC将存储旧的符号和名称的记录,以避免今后出现混乱。到目前为止,大约有27个基因的名字在过去的一年里被这样改变,但指导方针本身直到本周才正式公布。

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请与我们联系,我们将及时更正、删除,谢谢。

查看全文

点赞

西贝网

作者最近更新

  • 詹姆斯·韦伯望远镜将目光投向115亿年前 捕捉到令人惊叹的"彩虹结"
    西贝网
    2022-10-21
  • 物理学家对质子结构异常现象感到疑惑
    西贝网
    2022-10-21
  • 科学家发现世界上第一张已知星图:被藏在一座修道院里
    西贝网
    2022-10-24

期刊订阅

相关推荐

  • 浅谈我国医疗智慧物联网应用现状及未来发展

    2018-12-03

  • 美国首批附带传感器的数字化药片上市

    2018-12-08

  • 传感器概述:认识传感器的第一步

    2019-06-10

  • 科学家开发出一种含有纳米级纤维的人造皮肤

    2019-07-15

评论0条评论

×
私信给西贝网

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告