Speaker 1: Vielen Dank. Ich werde also Zeit nehmen. Ich habe meinen Twitter-Handle da oben angelegt. Es heißt At the Zooniverse, wenn ihr wollt, At the Zooniverse. Zooniverse begann fast zehn Jahre zuvor mit diesem Projekt, Galaxy Zoo. Es war sehr viel ein Experiment. Ein Studierender namens Kevin hatte ein großes Problem. Zu dem Tune von ca. 1 Mio. Bildern. Er wurde gefragt, sie in eine Galaxiespiralform, die ihr hier seht, zu sortieren. Oder in einer flachen elliptischen Form. Man konnte nicht wirklich weitergehen und die grundlegenden Forschungsfragen dieses Datasetzes fragen, bis das getan wurde. Er war im Pub mit Chris Lintott und Freunden. Sie fragten sich, ob die Mitglieder des Publikums auf diese Art von Aufgabe eingeladen werden könnten. Chris war am Abend auf der BBC Sky, was sehr handig war. Er sagte, sie sollten in diesem Projekt, Galaxy Zoo, teilnehmen. Mehr als 1.000 Menschen standen da und haben das Projekt, das Kevin ein paar Jahre lang gemacht hätte, in ein paar Wochen gemacht. Sie haben nicht nur einmal jedes Bild angeschaut, sie haben jedes Bild etwa 38 Mal angeschaut. Sie haben also sehr robuste Daten für jedes Bild erhalten. Und wenn es ein hohes Niveau von Ungleichheit in einem bestimmten Bild gab, waren Experten, die das dann angeschaut haben. Manchmal gab es keine Resolution. Manchmal waren die Daten mit Artefakten oder Verrückten verbunden. Es war also nicht gut zu beurteilen, warum ein Experte das auch machte. Das Zoo-Universum hat sich in vielen Projekten entwickelt und sie haben das alle gemeinsam. Mehrere Volontäre sehen jedes Bild, Audio- oder Videospiel-Film und erledigen die Aufgaben selbst. Mehrere Antworten werden dann vergleicht und zusammengearbeitet für eine einzige Antwort. Das gibt uns ein hohes Niveau von Sicherheit über das, was in einem bestimmten Bild ist. Und dann versuchen wir, die Zahl der Bilder, die Experten anschauen müssen, zu reduzieren. Denn wenn Experten all die Daten durchgehen könnten, das würde uns nicht als Projekt für diese Plattform anstrengen. Und Experten bekommen dann ihre rahen und aggregierten Daten, mit denen sie arbeiten können. Das Zoo-Universum hat jetzt über 1,5 Millionen Volontäre und über 50 besprochene Projekte, wo wir mit einem Forschungsteam oder einer Glam-Organisation saßen und uns gefragt haben, was unsere spezifischen Bedürfnisse sind. Ich werde zurückkommen, wie das anders ist als das, was wir in den letzten Tagen entwickelt haben. Einige davon wurden heute erwähnt. Noten aus der Natur und Wissenschaftsgeschichte sind wahrscheinlich von besonderem Interesse für die Leute in diesem Raum. Ich werde nicht über all diese Projekte sprechen, das werden Sie gerne hören. Aber ich werde mich ein wenig auf Wissenschaftsgeschichte und zwei andere Projekte beschäftigen, eines davon heißt Annotate und Shakespeare's World. Ich komme aus einem frühmodernen Literatur-Hintergrund und arbeite an Konventionen und Autobiografie. All diese Dinge sind für mich seltsam und wunderbar, außer für das Shakespeare's World-Projekt. Aber sie teilen ein gemeinsames Problem, oder einen Punkt von Interesse, nämlich dass Manuskripte, obwohl sie zunehmend machinenleistungsfähig sind, und die Mitglieder des Publikums teilnehmen müssen, sind eine wachsende Option. Aber natürlich haben wir schon einige Aufmerksamheiten gehört, sowohl über den Prozess des Arbeiten mit dem Publikum als auch darüber, dass das eine Art von Arbeit ist und es wichtig ist, unsere Volontäter zu respektieren. Science Gossip fragt 21. Jahrhundert-Zivilwissenschaftler, um das Werk von 19. Jahrhundert-Zivilwissenschaftlern zu entdecken, die zu sehr eklektischen Periodikalen teilgenommen haben. Wir kamen mit dem Team der Konstruktion der wissenschaftlichen Gemeinschaften zusammen, das auf Oxford und Leicester basiert. Wir haben uns mit dem Botanischen Garten in Missouri zusammengefasst. Sie kamen zu uns mit der Bibliothek der Biodiversität und sagten, wir wollen Bilder abstellen und mehr Metadaten und Informationen hinzufügen, damit die Bilder auch suchbar sind, genauso wie das OCR-Text, das in dieser wundervollen Kollektion steht. Glücklicherweise hat Jeff Belknap, der heute im Publikum ist, auf die Kultur der Ausdruckung in diesen eklektischen Periodikalen gearbeitet. Das war ein schöner Kurs. Wir haben das Projekt eröffnet und das ist hoffentlich ein kleines Video. Du gehst und markierst, ob es ein Bild gibt, und dann kannst du Informationen dazu hinzufügen. Nicht alle verschiedenen Typen von Informationen, die du auf der rechten Seite siehst, befinden sich in jedem bestimmten Beispiel. Und diese werden wiederum zusammengearbeitet. Interessant ist, dass wir einen robusten Gespräch durchgeführt haben, das ist der Diskussionsforum, über die Frage, ob Bilder automatisch entdeckt werden sollten, denn es gibt viele Algorithmen, die das tun können. Und wir hatten einen sehr ehrgeizigen Volonteer, der einen Algorithmus am Wochenende geschrieben hat und gesagt hat, ich habe ein paar Beispiele aus dem Website der Biodiversitätsheritage-Librarie heruntergezogen. Ich habe die Bilder automatisch entdeckt. Warum können wir das nicht einfach tun und mit Dingen präsentiert werden, die Bilder darin haben? Im Vergleich dazu haben wir an einem anderen Projekt gearbeitet, ein Snapshot-Serengeti, das Bilder von Tieren zeigt, aber oft sind die Kameraschrecken von Winden getriggert. Man hat also nur Gräser, die über den Bildschirm fliegen. Und obwohl wir, als wir untersucht haben, die Benutzer uns wieder und wieder gesagt haben, dass sie die Bilder von den Dingen sehen wollten, die sie magten, die Zebras und die Löwen und so weiter. In Wirklichkeit haben sie mehr Arbeit gemacht, als nur Blankbilder präsentiert wurden. Wir haben also nur Text-Bilder entdeckt. Wir haben also regelmäßig eine robuste Diskussion darüber, aber wir wissen, dass es mehr Arbeit erzeugt und auch mehr Diskussion über das Gespräch, das ist das Forum, das ihr hier seht. Aggregierte Daten. Ein weiteres kleines Video. Das ist eine Art Stop-Gap-Messung. Wir werden endlich in die Biodiversität-Heritage-Librarie gehen, aber wir haben es auf eine Webseite gestellt, explore-science-gossip.org, so dass man jede Seite des Projekts sehen kann, die bereits prozessiert wurde. Und man sieht die kleinen Marken, die die Maus da anzeigt, die zeigen, was die Individuen gesagt haben, und dann die Karte, die sagt, dass das Bild hier ist. Und dann die Wörter, die geändert wurden. Und wir halten alles. Wenn nur eine Person etwas sagt, ist das in Ordnung. Und sonst gibt es da eine Aggregation. Anna Tate entwickelte sich mit diesem Projekt zusammen, und das war in Partnerschaft mit Tate Archives & Museums und fokussierte sich auf die Bücher, ob das Schriftstücke, Briefe oder Diarien sind, produziert von meistens 20. Jahrhunderts britischen und emigreischen Künstlern. Das Ziel des Projekts war, den Zugang zu Tate Archives zu demokratisieren. Ich bin mir sicher, das ist ein gemeinsames Thema für viele von uns hier heute. Um die Künstler und ihre Bücher enthusiastisch zu machen, und nicht nur das letzte Produkt, sondern auch das Prozess, das zu diesem Produkt führt, um wörtersearchable Transkriptionen zu produzieren, die dann in den Online-Katalog gehen, der wiederentwickelt wird, und das ist nicht nur ein Ort, an dem man archivierte Dinge sucht, sondern man kann auch Objekte schauen und Biografien über Künstler sehen, und so weiter. Sie versuchen, eine ganze Sing-und-Tanz-Search-Plattform für ihre Kollektionen zu schaffen. Mein Ziel, das aus einer Forschungsperspektive herzustellen, war, eine neue Arbeitsfläche für crowd-sourced Transkriptionen zu schaffen, die nicht die weiße Box gibt und sagt, transkribiere, was du hier siehst, sondern es ein bisschen mehr zerstört. Eines der Herausforderungen, die Chris Lintott mir vorgestellt hat, als ich gesagt habe, dass ich Text-Transkriptionen auf der Zooniverse-Plattform machen wollte, in einer etwas naiven Art, war, wie man die schwierigen Aufgaben erreichbar machen kann. Wir wissen von Berichten, die von Melissa und ihrem Team publiziert wurden, und von anderen, die mit Volonteeren auf crowd-sourcing gearbeitet haben, und von Transkriptionen, dass es schwierig ist, und man kann Fehler machen, wenn man jemanden fragt, einen Volonteeren, und man kann auch ziemlich überrascht fühlen, was, wenn man einen Fehler macht, usw. Microtasking ist der Weg nach vorne, aber hoffentlich in einer positiven Art, also etwas runterzubrechen, damit die Leute einen Weg finden, nicht microtasking zu machen, im Sinne von kleinen Teilen der Arbeit für einen kleinen Anteil an Zahl. Die Hypothesis, und es war sehr viel eine Hypothesis, ist, dass Microtasking weniger Zeitverschuldung von den Usern erfordert, aber sie dann vielleicht länger auf einem Projekt bleiben kann. Diese Idee wurde von Gaming genommen, was wir von der Gaming-Industrie gelernt haben. Wir wollten hoffentlich Datenqualität verbessern, indem wir gegen User-Fatigue und gemeinsame Fehler, wie iSkip, für uns die Zahl der Leute, die eine bestimmte Seite sehen, minimieren. Wir haben mit Projekten wie Operation War Diary, ein anderes Zooniverse-Projekt, eine Seite zu zeigen, die N-Zahl der Leute ist. Was typisch passiert, ist, dass die Leute am Anfang der Seite starten. Sie können nicht sehen, was andere Leute geschrieben haben. Das Ganze wird an den Anfang und auf den einfachsten Aufgaben gestaltet. Also die Unterhaltung von Daten und Namen ist z.B. ein bisschen einfacher als eine interpretative Entscheidung, ob die Truppen unter Feuer sind oder ob sie zurückgehen oder weitergehen, oder wie auch immer das Fall ist. Wir wollten alles auf einer Seite machen, ohne 20 Leute zu bitten. Ich würde gerne 5 oder 3 Leute auf einer Seite bitten. Das ist Annotation in Aktion. Man benutzt das Dot-System, um das Stück Text zu wählen, das man transkribieren will. Man kann basicalle Dinge sagen, ob der Text ausgelöst wurde oder ob etwas nicht auf Englisch ist. Ein unserer Belgier-Volontären hat uns getroffen und gesagt, dass sie keinen freien Text sagen wollten. Wir haben gesagt, dass sie recht waren. Wir geben auch die Möglichkeit, dass die Leute etwas diskutieren können. Wie bei jedem Projekt, kann man zum Talk-Forum gehen und darüber reden. Man kann Bilder markieren. Etc. Ein paar Basis-Annotations-Stats. Wir haben im September 2020 31.000 Sessionen und 100.000 und 10.000 Klassifikationen, die von Volontären aufgeführt wurden. Ein hoher Anteil der registrierten Nutzer, in Bezug auf die Leute, die monatlich aufstehen, ist natürlich kleiner als das, aber es sind ein paar Hundert. Und 10.000 vollständig transkribierte oder verabschiedete Seiten. Wenn wir es nur auf dem Level von einer Seite zeigen und das akzeptieren, wenn wir die Seiten individuell überprüfen, geht das schneller, aber es ist ein ganz anderes Arbeiten, als das, was wir entwickelt haben. Shakespeare's World, der Grund, warum ich in die Zooniverse kam, war ein Projekt, welches sich auf frühmodernen Materialien konzentriert, und wir haben ein größeres Anteil registrierter Nutzer, und ein gesundes Anteil von Klassifikationen, aber weniger Seiten verabschieden. Und ich denke, dass mehr Leute ein bisschen an verschiedenen Seiten verabschieden, und nicht sagen, ich bin fertig mit dieser Seite. In diesem Fall ist es fast dasselbe wie Annotate, aber es gibt ein paar mehr Glocken und Klingeln, die verbunden sind, um Leute zu ermöglichen, die paleografischen Fähigkeiten zu entwickeln. In diesem Fall können sie auch gemeinsame Brevi-Grafiken oder Abbreviationen wählen, die Leute in frühmodernen Englisch mit TEI verabschieden können. Wir sind nicht verabschiedet von TEI, aber es ist ein hilfreiches Standard, das da draußen ist, und man kann auch kleine Textschnippel wählen, wenn man reingeloggt ist, und sie für zukünftige Referenzen verwenden. Alle Folter, Bilder sind auf ihrer Webseite, sie können unter creativecommons oder in der Webseite verabschiedet werden. Sie können auch ihre Referenzen wählen, sie können ihre Referenzen wählen, sie können ihre Referenzen wählen, sie können ihre Referenzen wählen, sie können ihre Referenzen wählen, sie können ihre Referenzen auswählen Es ist ziemlich gut. Ich weiß nicht, wie viele von Ihnen frühmodernes Handwriten mit einer Linie durchlesen können, aber es ist in der Tat ziemlich gut. Und der einzige kleine Fehler, der gemacht wurde in diesem automatisierten Ausgang, ist, dass das Page-Nummer in einem schmutzigen Ort ist, weil wir T.E.I. nicht benutzt haben, um zu sagen, wo das Ding hingehen sollte. Wir haben keinen Mark-up gemacht, um das Page-Layout zu erneuern, weil wir entschieden haben, dass das ein bisschen zu viel ist. Die zweite Hälfte, das ist aus einem Rezeptbuch, um einen Creme Cheese zu machen, falls Sie es versuchen wollen. Und dieses besondere Beispiel hat 99%-Aufgabe. Die meiste Aufgabe ist jetzt ein bisschen näher an 96%, was mit viel OCR oder Printen vergleichbar ist. Aber ich sollte sagen, Aufgabe und Präzision sind nicht das gleiche. Unsere Nutzer können sich über eine bestimmte Lesung einig sein, aber das bedeutet nicht, dass das eine präzise Lesung ist. Da wir das gesagt haben, ist es oft so. Ich bin nicht besonders wütend über diese Distinktion, aber ich wollte nur klar sein, dass es eine Veränderung gibt. Ich habe vorhin erwähnt, dass wir versuchen, den Leuten zu zeigen, wenn ein Stück Arbeit fertig ist. In diesem Fall sind die grünen Punkte eine Linie oder eine Sektion einer Linie, denn im Shakespeare-Welt kann man so wenig wie ein Wort machen, oder so etwas, was man lesen kann. Das bedeutet, das ist effektiv ausgestattet. Wenn man versucht, die Punkte dort hinzuzufügen, würde das einen Anruf auf eine andere Seite der Webseite geben, wo es keine Punkte gibt, oder man könnte sagen, man kann eine neue Webseite wählen. Ich denke, das würde unseren Prozess langsamer machen, aber ich denke, wir bekommen viel mehr Daten und wahrscheinlich akkurater Daten in der Langzeit, was gut ist. Ich habe vorhin gesagt, dass die Zooniverse aus besprochenen Projekten besteht, die uns ermöglichen, Risiken zu nehmen. Ich denke, wir sind sehr offen mit unseren Forschungspartnern, dass es alles ein Abenteuer und ein Experiment ist. Ich bin wirklich froh, zu sagen, dass wir einen großen Grundstück vom Institut für Museum und Bibliotheken in den USA bekommen haben, um freie Text- und Audio-Transkription-Toolen für den Projektbinder zu bauen. Wir haben etwas, das bereit ist, Text-Transkription zu machen, und wenn jemand in der Sache ist, der uns das ermöglichen möchte, ist das momentan eine Beta-Feature, und wir würden uns freuen, das für Sie zu machen. Schickt mir einfach eine E-Mail. Aber gleichzeitig, wenn Sie etwas länger warten, werden es mehr Glocken und Klingeln und ein bisschen mehr Kustomisierung, in Bezug auf das, was Sie tun können, zum Blick und Gefühl des Projekts. Ich glaube, es ist wichtig, dass Sie sich in der Lage haben, in der ersten Hinsicht schmutzig auszusehen, aber es wird Sie ermöglichen, den Job zu machen. Ich denke, die Note, die ich aufräumen möchte, ist, dass Crowdsourcing, Transkription und andere Formen von Crowdsourcing starke und wunderbare Dinge sind. Und mit Mitgliedern der Bevölkerung zu engagieren, wer auch immer sie sind, ist auch eine starke und wundervolle Sache. Aber ich denke, in den letzten 25 Jahren, in der gleichen Art und Weise, wie wir es jetzt tun, haben wir unsere Mitglieder und uns selbst als Forscher und Institutionen und Forschungsgruppen verfehlt. Denn ich denke, wir müssen in die Richtung gehen, die wir heute Morgen gehört haben. Ich war sehr aufgeregt, über diese Arbeit in Handwerksbezeichnungstechnologie und anderen Dingen zu hören. Das ist, glaube ich, ich will es nicht in den Knopf drücken, weil es seit ungefähr zehn Jahren ist, aber ich denke, das ist ein wirklich wichtiges Gebäudeblock und wir sollten es umbringen, aber es ist nicht für immer. Also ja, das ist wahrscheinlich genug. Und ihr braucht wahrscheinlich alle ein Getränk. Danke. Danke. Untertitel der Amara.org-Community
Generate a brief summary highlighting the main points of the transcript.
GenerateGenerate a concise and relevant title for the transcript based on the main themes and content discussed.
GenerateIdentify and highlight the key words or phrases most relevant to the content of the transcript.
GenerateAnalyze the emotional tone of the transcript to determine whether the sentiment is positive, negative, or neutral.
GenerateCreate interactive quizzes based on the content of the transcript to test comprehension or engage users.
GenerateWe’re Ready to Help
Call or Book a Meeting Now