künstliche intelligenz – content redaktion texte

Text: Humane Intelligenz ist zu Künstlicher Intelligenz wie Inklusive Sprache zu Inklusivem Programmieren, in

KIs & sprachliche Deutungsräume

Posted on 6. November 201815. April 2019 by theo in Inklusive Sprache, Misc

In meinem Kopf geht es weiter mit Sprache und Natural Language Processsing (NLP) durch Maschinelles Lernen.

Humane Intelligenz verhält sich zu Künstliche Intelligenz wie Inklusive Sprache zu Inklusives Programmieren

also:

HI:KI :: inklusive sprache:inklusives programmieren

.-)

Im A Beginner’s Quide to Word2Vec and Neural Word Embeddings habe ich Folgendes gefunden. Die schreibende Person des Artikels nutzt den ID-Anchor #crazy um folgende Passage intern zu verlinken:

Amusing Word2Vec Results

Let’s look at some other associations Word2vec can produce.

Instead of the pluses, minus and equals signs, we’ll give you the results in the notation of logical analogies, where : means “is to” and :: means “as”; e.g. “Rome is to Italy as Beijing is to China” = Rome:Italy::Beijing:China. In the last spot, rather than supplying the “answer”, we’ll give you the list of words that a Word2vec model proposes, when given the first three elements:

king:queen::man:[woman, Attempted abduction, teenager, girl]
//Weird, but you can kind of see it (skymind.ai)

Künstliche Intelligenz (KI) & Inklusives Programmieren (Incoding)

Posted on 5. November 201815. April 2019 by theo in Inklusive Sprache, Misc

Bei meiner Recherche zu dem Thema Künstliche Intelligenz und Stereotype (Vorurteile) stand die menschliche Sprache als Datenmaterial im Mittelpunkt.

Maschinelles Lernen hat jedoch zwei wichtige Elemente:

das Datenmaterial (z.B. Sprache)
die Programmierenden

Und mit beidem befasst sich die Algorithmic Justice League (AJL):

AJL -ALGORITHMIC JUSTICE LEAGUE (ajlunited.org)

Stichworte des Projektes sind: the coded gaze, algorithmic bias, unfairness, exclusion

Ziel des Projektes ist, den Einzug von Stereotypen und Vorurteilen (Sexismus und Rassismus) in KIs zu vermeiden.

Die Gründerin des Projektes Joy Buolamwini stellt das Projekt und die Hintergründe, die dazu führten, in einem ca. 9-minütigem TED-Video vor (deutsche Untertitel sind zuschaltbar):

Inclusive Coding (inklusives Programmieren) = Incoding

Joy Buolamwini betont bei dem Konzept des Incoding, des Inclusive-Coding, dem Inklusiven Programmieren, drei Dinge:

Who codes matters
How we code matters
Why we code matters

Ich sehe darin die Forderung nach mehr Diversität und Ethik. Transparente Algorithmen gehören für mich dazu!

Auf newscientist.com liest Du von 5 Fällen, die von Diskriminierung durch Algorithmen handeln:

Discriminating algorithms: 5 times AI showed prejudice (newscientist.com)

Eine Sammlung mit Artikeln mit weiteren Beispielen (auch: age, beauty) findest Du bei diversity.ai unter dem Menüpunkt ‹Press about us›:

diversity.ai: In media (diversity.ai)

Vielleicht auch lesen werde ich dann bald das Buch:

Weapons of Math Destruction (wikipedia.org)

Sprache: menschliche Deutungsrahmen (framing) und künstliche Deutungsräume (word embedding)

Posted on 31. Oktober 201815. April 2019 by theo in Korrekte Sprache, Misc

In meinem Post über Sprache, Stereotype, Künstliche Intelligenz (KI) und dem Natural Language Processing (NLP) habe ich bereits ein kleines Fazit gezogen.

Jetzt folgt ein Post-Fazit:

Die mathematischen Deutungsräume (und damit auch Stereotype (language bias)), die durch Vektoren beim Word-Embedding in der KI entstehen, entsprechen dem, was auf menschlicher Seite im Zusammenhang mit Sprache Deutungsrahmen (Framing) genannt wird.

Also:

HI : KI :: Deutungsrahmen : Deutungsraum

HI= Humane Intelligenz
KI= Künstliche Intelligenz

Formulae for gender neutral word embedding

Sprache & künstliche Intelligenz = Stereotype

Posted on 29. Oktober 201815. April 2019 by theo in Korrekte Sprache

«PS: In jetziger Zeit kommt hinzu, dass wir unsere sprachliche Unkorrektheit an künstliche Intelligenzen weitergeben! Siehe z.B. auf Englisch, sciencemag.org: Even artificial intelligence can acquire biases against race and gender» (inklusiv korrekt positiv: bewusst kommunizieren, Kapitel Signalwörter: das generische Maskulinum)

Im eBook hat es nur für eine Fußnote gereicht. Jetzt hatte ich Zeit, mich mit diesem spannenden Thema zu beschäftigen.

Natural Language Processing (NLP)

Wie macht eine KI Sinn aus unserer Sprache?

Indem sie durch Machine Learning große Datensätze an Text (corpus) menschlicher Sprache (natural language) verarbeitet und in mathematische Modelle (vector spaces) umwandelt.

Wiederholung (co-occurence) und Kontext (word embedding) sind dabei entscheidende Kriterien, um Wörter miteinander in Verbindung zu bringen (semantic connections, associations).

Auf diese Weise nähert sich eine KI der Bedeutung eines Wortes.

Dieser Prozess wird als Natural Language Processing bezeichnet (NLP)

Auf wikipedia.org:

Zurzeit nutzt Google:

Word2vec (wikipedia.org)

Facebook:

fastText (wikipedia.org)

Von der Stanford University:

GloVe (machine learning) (wikipedia.org)

Stereotype

Die enormen Datenmengen an verarbeitetem Text reproduzieren dabei in der KI die Stereotype, die bereits in unserer Sprache vorhanden sind.

Z.B. das englische geschlechtsneutrale Wort ‹programmer›. ‹Programmer› tritt sehr oft im gleichen Kontext mit ‹he› und ‹computer› auf. Wohingegen z.B. ’nurse› mit ’she› und ‹costume› in Verbindung steht.

Oder: Europäisch-Amerikanische Namen finden sich in einem ‹positiven› Deutungsraum der KI wieder (happy, gift). Wohingegen afrikanisch-amerikanische Namen in einem ’negativen› liegen.

«“If you didn’t believe that there was racism associated with people’s names, this shows it’s there,” said Bryson» in einem Interview (guardian.co.uk)

Die zentrale Studie zu dem Thema ist von 2017:

Semantics derived automatically from language corpora contain human-like biases (sciencemag.org)

Die Forschenden (Aylin Caliskan, Joanna Bryson und Arvind Narayanan) präsentieren ihre Studie ebenfalls in einem kurzen Video:

Artikel, die sich mit der Studie beschäftigen:

AI programs exhibit racial and gender biases, research reveals (guardian.co.uk)
Language is training artificial intelligence to replicate human bias (popsci.com)
AI Learns Gender and Racial Biases From Language (spectrum.ieee.org)
Investigating Bias In AI Language Learning (i-programmer.info)

Bereits 2016 deuteten einige Artikel von technologyreview.com auf den Zusammenhang von Sprache, Sexismus und KIs hin:

Intelligent Machines:How to Fix Silicon Valley’s Sexist Algorithms (technologyreview.com)
Intelligent Machines: How Vector Space Mathematics Reveals the Hidden Sexism in Language (technologyreview.com)

Die Lösung?

Via:

AI: Researchers develop a method that reduces gender bias in AI datasets (venturebeat.com)

Es gibt schon eine Lösung, zumindest für KIs, welche GloVe nutzen: Gender-Neutral GloVe, kurz: GN-GloVE

Learning Gender-Neutral Word Embeddings (PDF, arxiv.org)

Die KI korrigiert ihre Vektoren und wird en-stereotypisiert (debiased).

Das sieht dann so aus:

<ironie>Tja, Data-Wissenschaftler und Wissenschaftlerinnen haben es einfach .-) </ironie>

Ich denke, für humane Intelligenzen, die deutsch sprechen, lässt sich ein Teil des kryptischen Screenshots sehr schnell übersetzen: vermeide das generische Maskulinum.

Mein Fazit

Die oben genannte Studie bezieht sich auf die englische Sprache.

«…but things get more gendered [in languages] such as German…» Aylin Caliskan (popsci.com)

Sprache ist nicht neutral und war es nie. Die Studie über Sprache und KIs zeigt, dass ein Zusammenhang zwischen Sprache und menschlicher Wahrnehmung (Kognition) und menschlichem Denken (z.B. Stereotype) besteht.

«How does bias get into language, do people start making biased associations from the way they are exposed to language? Knowing that will also help us find answers to maybe a less biased future.” Aylin Caliskan (popsci.com)

KIs und unsere Wörter

Posted on 23. Oktober 201815. April 2019 by theo in Inklusive Sprache

Der Süddeutschen Zeitung lag ein buntes Beiblatt bei: eine Anzeigensonderveröffentlichung von Google. Der Titel: Aufbruch – Künstliche Intelligenz – Was sie bedeutet und wie sie unser Leben verändert (06.10.18).

Zu den Fragen «Wie machen wir KI gerecht?» und «Können Algorithmen Vorurteile haben?» (S. 30) antwortet Fernanda Viégas, Leiterin der Goolge-Initiative PAIR (People+ AI Research):

«Digitale Voreingenommenheit entsteht üblicherweise durch Tendenzen im Datensatz, mit dem das Machine-Learning-System trainiert wird. Gibt es eine Unausgewogenheit in den Daten, wird sie sich auch in den Ergebnissen des Systems zeigen. Wenn etwa ein Datensatz mit Aussprachebeispielen auf männlichen Rednern basiert, wird ein Spracherkennungssystem, das auf diesen Daten basiert, sehr wahrscheinlich bei Männern besser funktionieren als bei Frauen. Ein solches System bezeichnen wir als voreingenommen zugunsten von Männern.»

Das hört sich gut an. Wir müssen uns mal wieder mit unserer Sprache auseinandersetzen. Diesmal in der Form von Datensätzen in menschlicher Sprache.

Wenn ich dann jedoch auf Seite 34 der Werbung für KIs von Google lese:

«Den Gedanken, dass Programmierer sich ihrer sozialen Verantwortung bewusst werden müssen, finde ich extrem bedeutsam.» (Peter Dabrock)

dann wird mir angst und bange. Nicht nur wegen der fehlenden Ethik-Kompetenz aufseiten der Programmierenden, sondern wegen des generischen Maskulinums des Ethik-Professors.

Wie ethisch sind Visionen formuliert im generischen Maskulinum? Welche ethische Kompetenz kommuniziert der Vorsitzende des Deutschen Ethikrats damit? Wie ethisch ist seine Ethik?