Natürlich muss man in der Genforschung viel mit Zahlen und Daten anfangen. Es liegt also nahe, dass viele Forscher Excel-Software verwenden, um diese Daten zu verwalten und auszuwerten. Aufgrund dieser allgegenwärtigen Predigt in der Microsoft-Tabelle mussten 27 menschliche Gene umbenannt werden.
Das Problem liegt in einer Besonderheit der Microsoft-Software: Sie versucht, die Dateneingabe zu interpretieren. Wenn Sie beispielsweise „3NOV20“ in ein Datenfeld eingeben, gibt Excel es automatisch an den 3. November 2020 zurück, den Tag der US-Präsidentschaftswahlen. Dies kann in Einzelfällen offensichtlich sein, aber solche Änderungen sind schwierig. um zu verstehen, wann Dutzende oder Hunderte von Datensätzen gleichzeitig in das Programm importiert werden und nur wenige von Excel geändert wurden.
Aber genau das passiert in der Genforschung regelmäßig als Analyse im Jahr 2016 gezeigt. Ein Fünftel der damals untersuchten wissenschaftlichen Veröffentlichungen enthielt Fehler, die auf automatische Datenkonvertierungen aus Excel zurückzuführen waren und von den Autoren nicht bemerkt wurden.
Anweisungen ändern
Jetzt berichtet das Technologiemagazin The Verge, dass das HUGO Gene Nomenclature Committee (HGNC) dafür verantwortlich ist Organisation des menschlichen Genoms gehört, möchte solche Fehler in Zukunft ausschließen, indem verschiedene Gene umbenannt werden, damit die Begriffe Excel-kompatibel sind, beispielsweise nicht automatisch in Datumsangaben konvertiert werden. Genau das nennt das Gen MARCH1 (Finger verbunden mit dem Ring verbunden mit der Membran 1), die Excel am 1. März in den USA geändert hat, dh. 1. März, ohne gefragt zu werden.
In dem Update, das diese Woche veröffentlicht wurde Gen-Benennungsrichtlinie HGNC erklärt, dass die Gensymbole „die die Datenverarbeitung und das Abrufen beeinflussen“ geändert werden. Insbesondere bedeutet dies alle Begriffe „die in Microsoft Excel automatisch in Daten konvertiert wurden“. Daher heißt MARCH1 MARCHF1, SEPT1 wird in SEPTIN1 umbenannt.
Die Aufklärung zog sich zurück
Der Schritt scheint die endgültige Lösung für das Dilemma zu sein, das das Panel gesehen hat. Zuvor hatte HGNC Anstrengungen unternommen mit einem Video auf YouTube Zeigen Sie das Problem und erklären Sie gleichzeitig, wie die automatische Konvertierung von Gennamen in Kalenderdaten deaktiviert wird.
Der Versuch war jedoch nicht besonders erfolgreich. Seit seiner Veröffentlichung im März 2019 wurde der Clip bis Freitagmorgen nur 371 Mal angesehen. Man kann spekulieren, dass eine große Anzahl dieser Klicks auf die Tatsache zurückzuführen ist, dass das Video mit dem Artikel aus „The Verge“ verknüpft ist. Immerhin hat mindestens ein Forscher es gesehen und bedankt sich in der Kommentarspalte für „gültige Richtlinien“.
Ein Problem so alt wie Excel
Das ebenso ehrgeizige wie erfolglose Video zeigt das grundlegende Problem, mit dem Wissenschaftler zu kämpfen haben: Jeder glaubt, Excel beherrschen zu können, aber kaum jemand tut es wirklich. Microsoft Spreadsheet wurde erstmals 1985 für den damaligen Apple Macintosh veröffentlicht und zwei Jahre später als Windows-Version herausgebracht.
Seitdem wurde die Software mehrmals geändert und neue Funktionen hinzugefügt, aber die Grundfunktionen sind gleich geblieben. Selbst diejenigen, die unter MS-DOS noch mit dem Excel Multiplan-Vorgänger gearbeitet haben, hätten kein Problem damit, die aktuelle Version von Excel zu verwenden, zumindest in den Grundlagen: Tabellen öffnen, Daten und Formeln schreiben, Ergebnisse lesen.
Die Möglichkeit, Software für die automatische Datenkonvertierung zu verwenden, indem ein Datenfeld in Excel als Textfeld definiert wird, dessen Inhalt von Excel nicht geändert wurde, scheint wenig bekannt zu sein. Einfach: Sie geben das Datenfeld oder die Datenfelder, die Sie vor Änderungen schützen möchten, mit der Maus ein, klicken mit der rechten Maustaste, um das Kontextmenü zu öffnen, und wählen dort die Eingabetaste aus Zellen formatieren. Klicken Sie im jetzt geöffneten Fenster auf Text Und das hatte damit zu tun. Microsoft erklärt diese Funktion wie folgt: „Der Inhalt der Zellen wird genau so angezeigt, wie sie eingegeben wurden.“