Eine Sokal-Affäre der Informatik

Gerade bei Heise gelesen: Mit dem Pseudonym Herbert Schlangemann wurde ein mit dem Tool SciGen generiertes, sinnloses Paper mit dem Titel “Towards the Simulation of E-Commerce” an die Reviewer des CSSE 2008 (International Conference on Computer Science and Software Engineering) geschickt. Diese fanden es so toll, dass sie auch ein CV von dem Pseudo-Herren anforderten und ihn sogar zum Leiter des Themenkreises “Distributed and Parallel Computing & Embedded Programming” für die Konferenz machten.

Erinnert mich ein bisschen an Alan Sokal und sein Paper Transgressing the Boundaries: Toward a Transformative Hermeneutics of Quantum Gravity”(Deutsche Übersetzung findet sich hier), das 1996 in der Zeitschrift “Social Text” veröffentlicht wurde.

Naja, seit ein paar Jahren gibt es ja auch Programme, die automatisch generierte Pseudo-Papers identifizieren sollen. Der Krieg kann also beginnen…

Das Problem dürfte jedenfalls nicht nur eines der Poststrukturalisten sein.

4 thoughts on “Eine Sokal-Affäre der Informatik

  1. Hier ein Textbeispiel, mit dem ich vor Kurzem zu tun hatte. Eine Art “automatisch generiertes Pseudo-Paper”:

    “Neue Produktideen werden vom Center for Postgraduate Studies identifiziert und mit den entsprechenden internen und externen Kooperationspartner in Eigenregie umgesetzt. Ausbau intensiver Verbindungen zu führenden Unternehmen und Organisationen. Anbindung hochrangiger Personen von namhaften Organisationen und Unternehmen beispielsweise als Beiräte diverser Weiterbildungsaktivitäten.”

    “In diesem Kontext wird auch der Ausbau von Management Development Programmen forciert, sowie etwaige Kooperationen mit Unternehmen und Organisationen eingegangen, um maßgeschneiderte, universitäre Weiterbildungsangebote anzubieten. Anreizsysteme entwickeln, die Universitätsangehörige dazu verleiten, vermehrt Dozententätigkeiten in Weiterbildungsangeboten der Universität Wien zu übernehmen, um dem Drift zu externen, gutbezahlten Weiterbildungsanbieter einzudämmen. ”

    “Fundraising: um den nachhaltigen Wachstum der Weiterbildungsaktivitäten der Universität Wien zu gewährleisten, sollen auch Formen des Fundraising zum Tragen kommen. Bspw. Donatoren akquiriert werden, um ein eigenes repräsentatives Weiterbildungszentrum für die Universität langfristig mitzufinanzieren. Einrichtung eines Stipendienfund mit Hilfe von Unternehmen und Organisationen, der Weiterbildungsstipendien für hoch qualifizierten Nachwuchs (auch aus einkommensschwächeren Ländern) vergibt.”

    “Möglicher Ausbau der Stellen für facheinschlägige Mitarbeiter, die für die einzelnen Cluster am Center for Postgraduate Studies zuständig sind. Vor allem durch das Angebot von gewinnbringenden, eigenen Produkte des Center for Postgraduate Studies und den Overheads aller Programme soll das Stellenwachstum eigenfinanziert bewerkstelligt werden. Engere Kooperationen mit Universitäten sollen intensiviert werden, um gegenseitige Spezialisierung zu ermöglichen und konkurrierende Angebote zu vermeiden. Gewinnung internationale Partneruniversitäten für gemeinsame Weiterbildungsprogramme. Als auch die Ausrichtung auf neue Märkte (z.B. neuen EU-Mitgliedsstaaten, Indien und China) wird fokussiert”

    Die grammatische Inkonsistenz der letzten beiden Sätze wäre allerdings einem Programm kaum unterlaufen. Dazu braucht man schon menschliche Autorenschaft.

  2. Gibt es eine Auflösung, d.h. kennt man die Art der Autorenschaft?

    Mir fehlen – vor allem bei Absatz 1 und 2 – Verbindungs- und Füllwörter.

    Würde man zwischen den Sätzen Bullet Points setzen, die Formatierung etwas ändern und eventuell noch ein paar hübsche Cliparts hinzufügen, dann würde ich die ersten drei Absätze als schlechte Power Point Folien klassifizieren. 🙂

    Der vierte Absatz ist etwas seltsam: “von […] eigenen Produkte”, “. Als auch…”, “Gewinnung” und “( z.B. neuen Mitgliedsstaaten” sehen auch für mich nicht nach einem Tool aus; im äußersten Fall ist es ein schlechtes Übersetzungsprogramm.

    1. Ein kleiner Probetext

      Die Auflösung ist “Projektprosa”. Es handelt sich um den Ausschnitt aus einem an der Universität Wien genehmigten Arbeitsprogramm. In diesem kurzen Textstück fällt auf:

      “um den nachhaltigen Wachstum”
      “Einrichtung eines Stipendienfund”
      “Angebot von gewinnbringenden, eigenen Produkte”
      “Gewinnung internationale Partneruniversitäten”

      Das sind nur die eklatanten Tipp- und Kasusfehler. Dazu kommt der schon erwähnte Grammatikflop und idiosynkratische Wendungen wie “… sollen Formen des Fundraising zum Tragen kommen …” Man muss sich vor Augen halten, dass es sich um ein Dokument handelt, auf dessen Basis eine Kulturinstitution (darauf legt sie großen Wert) wie die Universität Wien Geld investiert.

  3. Es ist wirklich in manchen Fällen schwer zu entscheiden, ob hinter dem Text ein Bot oder ein Mensch steht. Im Bereich, wo es nicht um bezugnehmendes Antworten auf eine Frage geht sondern wo ein fertiger Text vorliegt, scheint der Turing-Test leichter zu gewinnen 🙂

    Hier ( http://netzpolitik.org/2009/revolution-bei-suedeutschede-schreiben-jetzt-bots/ ) wird zum Beispiel diskutiert, ob ein Artikel aus der Süddeutschen von einem Bot generiert wurde, weil der Argumentationsgang als unzusammenhängend identifiziert wurde. Die Grenzen verschwimmen also.

    Interessant ist die Beobachtung, dass Fehler bei Rechtschreibung oder Grammatik oder Fehler bei einer bestimmten Art von Wissen dazu führen, dass man die Texte als vom Menschen generiert beurteilt.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.