• Pixelpiet 08/01/2024 10:24

    Wird auch mein letzter Beitrag dazu werden, dazu sind die Bildkommentare eher nicht besonders gut geeignet ;-) Solche Diskussionen laufen nur dann ins Leere, wenn berechtigte Argumente oder Kritik als ermüdend angesehen werden.
    Würde sich doch nur einer der Fürsprecher mal dazu durchringen zuzugeben, dass es massive Probleme mit den verwendeten Daten der KIs gab und aktuell gibt, dann läge hier bereits eine ganz andere Ausgangsbasis vor. Ausklammern wird man diesen immensen Imageschaden nicht durch wegignorieren.
    https://www.golem.de/news/trainingsdaten-fragwuerdig-visuelle-generative-ki-mit-plagiatsproblemen-2401-180902.html
    Danke an Falk für seine Aufgeschlossenheit und auch das offen halten der Kommentare!
  • Falk Rauschenbach 08/01/2024 12:16

    Solange die Diskussion sachlich bleibt, werde ich sie auch offen halten.



    Was Datenklau ist und was nicht, wird letzten Endes ein Gericht auf Basis der existierenden Gesetze entscheiden. Und ich vermute, da müssen viele verschiedene Fälle separat voneinander beurteilt werden, weil von verschiedenen Leuten auf verschiedene Arten vorgegangen wurde.

    Ich nehme an, das Gericht wird sich dann an dem orientieren, was auch genausogut ein Mensch tun dürfte.

    Meine Vermutung:
    Wenn eine KI an einer öffentlichen Bildersammlung trainiert wird, was ein Porträt ist und was nicht, dann ist es vermutlich kein Datenklau. Schließlich darf das auch jeder Mensch tun und sich von öffentlichen Bildern inspirieren lassen, etwas Ähnliches zu schaffen.

    Wenn nicht-öffentliche Daten verwendet werden, dann ist es vermutlich ein Verstoß gegen Privatsphäre, Geheimhaltung und Ähnliches. Das ist generell verboten, völlig unabhängig von der KI.

    Wenn die KI dazu übergehen sollte, aus Bildern Versatzstücke herauszuschneiden und unverändert weiterzuverwenden, dann ist es vermutlich ein verstoß gegen das Urheberrecht und genauso verboten, wie wenn ich das von Hand machen würde. Ob die KI das tut oder nicht, kann ich nicht beurteilen. Ich nehme an, das muss auch wieder für jede KI einzeln bewertet werden.



    Die Freiheit, das eigene Bild durch Software gegen eine KI-Auswertung zu schützen, ist davon völlig unabhängig.
  • Falk Rauschenbach 08/01/2024 12:20

    Ich habe übrigens den Eindruck, das hier bei dem Thema Datenklau über zwei verschiedene Dinge gesprochen wird. 
    Einmal über die Frage, ob die KI vielleicht einfach Versatzstücke aus anderen Bildern herauskopiert und weiterverwendet und zum Zweiten die Frage, ob und wie weit und von wem beim Trainieren der KI Daten verwendet wurden, die nicht öffentlich waren und nicht hätten verwendet werden dürfen.

    Vielleicht sollte man das voneinander differenzieren.
  • Pixelpiet 08/01/2024 12:41

    Das kann man machen, meines Erachtens ändert das aber an der Ausgangslage, der Herkunft der fürs Anlernen eingesammelten und eben auch verwendeten Daten nichts. Und die fallen ja einigen KI-Herstellern und Betreibern ja auch weiterhin aktuell auf die Füße. Auch was die Qualität der Quellen angeht. Man darf also berechtigt annehmen, dass da etwas im Argen lag und aktuell noch liegt ;-) Gerade z.B. der letzte verlinkte Artikel geht auf aktuelle Generationen der bildgebenden KI ein. Wie dort auch zu lesen ist, wie man bereits versucht die jetzt teuer kommenden Schäden (inkl. Rufschaden) wieder mühevoll und mit viel monetärem Einsatz einzufangen oder von vornherein Fehler zu vermeiden. In Fachbereichen, in denen KI zum Einsatz kommt, ist letzteres und das Sauberhalten der Datenbasis unabdingbar.