Excel und der “Niedergang” der Genforschung …

Gut, der Titel ist etwas reißerisch, enthält aber einen Kern an Wahrheit. Vor ein paar Tagen ist ruchbar geworden, dass Veröffentlichungen im Bereich der Gentechnik verlottern, weil angehängte Excel-Tabellen mit Gen-Namen durch Autokonvertierung bis zur Unkenntlichkeit verhunzt werden. Die Forscher sagen: “Microsoft und dieses Excel haben Schuld”. Ich sage: “Die Spezies können vielleicht Facebook, nicht aber Excel bedienen”. Selbst in meinen Einsteigerbüchern weise ich auf die automatische Zellformatierung in Excel hin und zeige, wie man das löst. Danke an Blog-Leserin 1ei für den Tipp – wen es interessiert – ich habe es drüben für Generation 50 Plus aufbereitet.


Anzeige
Dieser Beitrag wurde unter Allgemein abgelegt und mit , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

8 Antworten zu Excel und der “Niedergang” der Genforschung …


  1. Anzeige
  2. anthropos sagt:

    Sie lottern also nicht nur bei Microsoft und seinen Updates für Windows. Ob das nicht eher zum Heulen ist als zum Weinen, will ich gar nicht entscheiden.

    • Herr IngoW sagt:

      Wer lesen kann ist klar im Vorteil, es liegt nicht an Microsoft sondern an den Hochbezahlten Wichtigtuern die nicht mal in der Lage sind ein simples Büro-Programm zu bedienen, oder ist “Excel” zu einfach für solche hochqualifizierten Herrschaften?

      • Ralf sagt:

        Sie haben sich jedenfalls auch nicht näher mit der Problematik beschäftigt.

        Es geht weder darum, dass Excel als Programm fehlerhaft ist noch dass die Anwender das Programm nicht bedienen können. Sondern ist es das alte Problem, wenn man größere Datenmengen manuell verarbeitet. Wer mit einer Tabellenkalkulation immer wieder größere Datenmengen importiert (CSV) (und kein Mensch gibt größere Datenmengen per Hand ein), dem passiert es halt immer mal wieder, dass die Zellformatierungen nicht passen und man vergisst, sie entsprechend anzupassen. Und wer länger in einem Thema arbeitet, der sieht irgendwann auch keine Fehler mehr (die einem Dritten auf Anhieb auffallen, aber auch nur zu Beginn).

        Ich bin inzwischen dazu übergegangen, in solchen Fällen solche Dateien per Python- oder auch .NET-Script zu erstellen und dabei die Formatierungen mitzugeben. Wenn man dann neu aufsetzen muss, kann man die Formatierungen nicht mehr vergessen.

        Ich bin weder Wissenschaftler noch muss hier unsere UNIs verteidigen, aber nach über 30 Jahren IT-Erfahrung kennt man seine beliebesten Fehlerquellen. Und ja, es sind hochqualifizierte Fachleute und nein, ausser den Führungskräften verdient man sich an den UNIs weder in der Forschung noch als studentische Hilfskraft oder Studierender eine goldene Nase. Und Excel und Word im Forschungsalltag zuzulassen, war letztlich keine Idee der Universitäten, sondern der Druck der Studierenden, mit bereits bekannten Produkten weiter arbeiten zu können. Mit Latex wäre das nicht passiert :-))

        Und das grundlegende Problem heute ist, das wir Probleme nicht mehr aufzulösen versuchen. Sondern eine Gruppe über die Programme (und eventuell auch Hersteller) herzieht. Und die andere Gruppe herablassend und beleidigend über Menschen und Berufsgruppen herzieht. Und da macht es nicht Wunder, dass sowohl im Forschungsbereich als auch im Ingenieurwesen die Chinesen schnell an uns vorbeiziehen.

  3. christian sagt:

    Ich arbeite in der Forschung an einer großen süddeutschen Uni und kann bestätigen, dass es KEIN von Microsoft verursachtes Problem ist. Die werten Damen und Herren Wissenschaftler haben oftmals keine Ahnung davon, dass eine Tabellenformatierung möglich und oftmals auch nötig ist. Klar, Excel versucht die importierten Daten automatisch ‘richtig’ zu deuten – was oftmals nicht reibungslos gelingt. Einzig vorwerfen könnte man Microsoft, dass sie Excel ab Installation nicht ‘textformatiert’ belassen und damit die automatische Erkennung ab Werk deaktiviert lassen. Das würde aber auch nichts helfen. Viele können den Konvertierungs-Assistenten beim Importieren von Datensätzen nicht bedienen und es gibt tatsächlich auch Wissenschaftler die die unterschiedlichen Formatierungen nicht unterscheiden können.

    Und noch etwas: die meisten Wissenschaftler arbeiten an/für Universitäten oder größere Unternehmen. Diese ‘sollten’ in der Regel im Bereich IT administriert sein. ‘Sollten’ bedeutet allerdings nicht immer, dass sie es sind. Wir haben Institute die es zulassen, dass die Mitarbeiter ihre IT selbst administrieren. Das spart angeblich Geld oder wie es an der Uni heißt ‘Stellen’ und so schwer kann es doch nicht sein ein paar Klicks zu machen weil es so in PC-Zeitschriften empfohlen wurde oder weil man über Google so gefunden hat. <- ERNSTHAFT! Damit bleiben diese Wissenschaftler was die richtige Bedienung angeht auch weiterhin dumm. Oftmals kann nämlich ein halbwegs fähiger Admin all diese 'Problemchen' mit geringem bis keinem Aufwand verhindern…

    • Ralf sagt:

      Es wäre in einer Tabellenkalkulation keine gute Idee, das Textformat als Standardformat zu haben. Noch schlimmer als eine falsche Textbezeichnung in einer Zelle wäre es, wenn das Programm auf einmal aufhören würde, zu rechnen und die Formeln nicht auszuführen. Denn ein Kardinalfehler in einer Tabellenkalkulation ist, den Ergebnissen zu vertrauen. Nicht, weil das Programm falsch rechnen würde, sondern weil man durch falsche Formatierungen es auch schaffen kann, Zellinhalte nicht mehr zum Rechnen zu verwenden. Von Formelfehlern und beliebten Rundungsfehlern ganz zu schweigen.

      Deshalb habe ich Excel-Schulungen auch immer versucht, den Anwendern zu vermitteln, dass man immer den Ergebnissen misstrauen sollte. Wenn einem das Gesamtbild und die berechneten Ergebnisse unplausibel erscheinen, dann muss man das überprüfen. Durch Excel werden falsche Zahlen und Berechnungen nicht richtig. Wenn man Mist baut, bekommt man auch Mist hinten raus :-))

      Letztlich hilft nur eins, was man auch sonst in der Programmierung heute einsetzt. Automatisierte Tests, ggfs. mit Prüftabellen und Makros oder extern mit Python-Scripts o.ä. .

      Und das Problem mit der IT-Betreuung und deren Missachtung gibt es überall. Im öffentlichen Dienst und größeren Industrieunternehmen. Der wirkliche Grund ist selten das Geld. (Das Fehlen einer zentralen IT-Betreuung ist meistens ohnehin auf längere Sicht teurer.) Es ist einfach das menschliche Ego, sich ungern von einer anderen zentralen Stelle Arbeitsweisen vorschreiben zu lassen. Und Profs waren da schon immer sehr selbstbewusst, was ich von Kollegen bei Schulungen und Tagungen mitbekommen habe.

  4. Anzeige

  5. Günter Born sagt:

    Nur eine kleine Anmerkung: Im verlinkten Original Artikel drüben in 50+ Blog ist definitiv die Aussage zu finden, dass die Datenanhänge im Excel .xls-/.xlsx-Format auf den Publikationsseiten eingestellt werden. Die csv-Problematik zieht also nicht. Es sind schlicht die Standard-Zellformate, die Ärger machen. Und wenn es Usus ist, dass die Dateien zwischen den Forschern zirkulieren, ist das noch weniger nachvollziehbar. Jedenfalls in meinen Augen.

    Es könnte höchstens beim Export in die Excel-Datei passieren.

    Bei heise.de gibt es einen geharnichten Kommentar http://m.heise.de/forum/iX/News-Kommentare/Verfaelschte-Tabellen-Excel-bereitet-Genforschern-Probleme/Mea-Culpa-Darwin-Award-2016-noch-offen-Forscher-die-Excel-basics-nicht-packen/posting-29100675/show/

    • Ralf sagt:

      Bei Winfuture steht aber auch, dass das Problem durch die meist automatisiert aus anderen Datenquellen übertragenen offiziellen Bezeichnungen von Genen entsteht, wenn diese dann durch die Microsoft-Software falsch interpretiert und in andere Schreibweisen umgewandelt werden.

      Die tippt doch keiner in die Excel-Dateien ab, die nachher publiziert werden. Sind doch meistens CSV-Dateien, die man dann importiert. Eine falsche Option beim Import ausgewählt oder beim x-ten Mal unaufmerksam gewesen und schon ist es passiert. Und dann ist unser Gehirn so schlau, sich auf die wesentlichen Dinge zu konzentrieren und Du siehst einfach die Fehler nicht mehr. Ist wie beim Schreiben hier im Blog. Du liest es zwanzigmal durch, um die Fehler zu korrigieren. Dann schickt man es ab und jeder Andere findet spontan zwei blöde Fehler :-))

      Und man muss auf der anderen Seiten ja auch mal sehen, dass immerhin 80% der Dateien richtig sind :-)) Und selbst Winfuture als softwarekundig schreibt etwas von Autokorrektur. Was es nun definitiv nicht ist, sondern nur die Darstellung des Zellinhalts im gewählten oder standardmäßigen Zellformat.

      Deshalb lieber Erstellen solcher Excel-Dateien per Script (dann wird nämlich jedesmal ohne menschliches Zutun immer die gleiche einmal festgelegte Formatierung verwendet) und bevor man eine Datei publiziert, nochmal ein Script rüberjagen, dass die gröbsten Fehler und Unplausibilitäten anmeckert.

  6. Dekre sagt:

    Vorab- ich liebe Excel und habe damit auch schon mehreres erstellt, nicht nur mit plus und minus gerechnet, trotzdem ist es immer wieder was Neues sich damit zu beschäftigen. Ich kenne aber den konkreten Datensatz nicht, weiß aber, dass man in Excel unterschiedlichste Datensätze einlesen kann und auch sinnvoll weiterbearbeiten kann und auch schon getan habe.
    Frage:
    Kann man die Daten denn nicht auch in Access importieren (gehen tut es), vielleicht ist es damit sogar besser wegen der größeren Verwaltung? Das setzt natürlich voraus, so wie ich es hier lese, dass man Access kann.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.