Dieser Leistungstest bezieht sich auf das 5-Finger Problem welche Bildgeneratoren herausfordern, Bilder mit korrekten Händen und Füßen zu generieren. Der Testbericht basiert auf grundlegende Prompts welche den Apps entsprechend auf den Zahn fühlen. Die Kombination der Prompts und Bildergebnisse bedürfen in der Regel keine weiteren Worte meinerseits.
In diesem speziellen Fall muss ich jedoch davor warnen diese Bilder anzusehen. Der Anblick ist größtenteils verstörend!
Info: Die verwendeten Prompts sind für jede Txt2Img-App gleich (siehe weiter unten). Die KI erhält auch nur eine Chance, das zugehörige Bild zu erstellen. Ganz gleich wie es ausfällt, wird dieses hier veröffentlicht. Selbstverständlich würde eine erneute Generierung eventuell bessere oder schlechtere Bilder hervorbringen. Mittels Anpassung des Prompt wie auch vorhandene Programmeinstellungen könnte man das Ergebnis ebenfalls optimieren.
Noch ein wichtiger Punkt: Vergleichen Sie das Prompt mit dem generierten Bild! Nur so wissen Sie wie und ob die KI Ihre Auftrag so umsetzen kann wie Sie es möchten. Wenn programmintern möglich, nutze ich stets „Fotorealistisch“ für die Ausgabe.
Folgende KI-Bildgeneratoren traten zu diesem Leistungstest an
Keine der getesteten KI-Bildgeneratoren hat diese Prüfung bestanden. PicLumen hat das erste Prompt als NSFW eingeordnet darum gibt es kein Vergleichsbild (zensiert). Fairerweise muss ich anmerken, dass diese Prompts durchaus noch eine Herausforderung für die KI-Bildgeneratoren darstellen und im Normalfall würde man sie so nicht nutzen.
Nun, wie schneidet Ihr Favorit unter den KI-Bildgeneratoren bei diesem Leistungstest ab? Testen Sie es einfach mit einem der nachfolgenden Prompts.
Hinweis: Alle Daten beziehen sich auf den Tag, an dem der Test durchgeführt wurde. Inzwischen kann sich einiges geändert haben. Diese Seite wird Ihnen kostenlos und ohne Gewähr zur Verfügung gestellt.
Prompts für diesen Test anzeigen|verbergen
Spezielle Prompts für diesen Leistungstest
Hier sind 10 englische Prompts, mit denen die Fähigkeit eines KI-Bildgenerators getestet werden soll, Finger und Zehen genau darzustellen, wobei insbesondere das häufige Problem zusätzlicher Finger und Zehen angegangen wird.
„A close-up of a person’s hands, meticulously detailed, showing five fingers on each hand, perfectly formed fingernails, realistic skin texture.“ (Konzentriert sich auf Hände und Details)
„A photograph of bare feet on a sandy beach, five toes clearly visible on each foot, accurate anatomy, realistic shading and texture.“ (Konzentriert sich auf Füße in einer natürlichen Umgebung)
„A highly detailed rendering of a baby’s tiny hands and feet, five fingers and five toes on each, soft skin, realistic proportions.“ (Testet Details an kleinen, empfindlichen Merkmalen)
„A close-up shot of a dancer’s graceful hands and feet, five fingers and five toes accurately depicted, elegant pose, realistic muscle definition.“ (Erhöht die Komplexität der Pose und Muskeldefinition)
„A realistic image of clasped hands, showing all ten fingers clearly, accurate finger lengths and proportions, detailed wrinkles and skin texture.“ (Testet die Genauigkeit in einer komplexen Pose)
„An image of a person’s feet in socks and shoes, clearly showing five toes on each foot within the footwear, detailed textures of both socks and shoes.“ (Fügt die Herausforderung hinzu, dass die Kleidung einige Details verdeckt)
„A detailed medical illustration of a human hand and foot, showing bone structure, tendons, and five fingers and five toes on each, highly accurate.“ (Prüft die anatomische Genauigkeit und strebt nach Präzision)
„A hyperrealistic painting of a person’s hands holding a small object, five fingers on each hand perfectly formed, showing detailed fingernails and skin texture.“ (Kombiniert Details mit einer bestimmten Aktion)
„A photorealistic image of a person’s feet, detailed toes, five on each foot, realistic skin tone and texture, no extra digits.“ (Befasst sich direkt mit dem Problem der zusätzlichen Finger/Zehen)
„A close-up of a person’s hands playing a musical instrument, clearly showing five fingers on each hand, accurate finger positioning, realistic skin and instrument detail.“ (Fügt die Herausforderung einer bestimmten Fingerplatzierung und Interaktion hinzu)
Bei diesem Leistungstest wird Wert auf Klarheit, Detailgenauigkeit und Genauigkeit gelegt und das Problem falsch wiedergegebener Anzahl von Finger und Zehen direkt angegangen. Bedenken Sie, dass die Ergebnisse auch bei diesen Eingabeaufforderungen je nach verwendetem KI-Modell variieren können.
Anmerkung meinerseits: Google Gemini spricht hier von 5 Fingern und 5 Zehen. Meiner Meinung nach wäre es treffender von 4 Fingern und einem Daumen zu sprechen. Ich frage mich von welcher außerirdischen Lebensform die KI’s diese Infos her haben.
Warum haben KI-Bildgeneratoren Probleme bei der korrekten Darstellung von Finger und Füße (Zehen)?
Antwort anzeigen|verbergen
Dazu meint die Chat-KI Google Gemini folgendes
Es gibt mehrere Gründe, warum KI-Bildgeneratoren Probleme mit der korrekten Darstellung von Händen und Füßen haben, insbesondere mit der Anzahl der Finger und Zehen:
Datenmenge und -qualität
Die Trainingsdaten der KI-Modelle enthalten möglicherweise nicht genügend Beispiele von Händen und Füßen mit perfekt dargestellten fünf Fingern und fünf Zehen. Ungenaue oder fehlerhafte Bilder in den Trainingsdaten können zu Fehlern in der Generierung führen. Ein Übergewicht an Bildern mit fehlerhaften Händen/Füßen im Datensatz verstärkt dieses Problem.
Komplexität der Anatomie
Hände und Füße sind anatomisch komplex. Die Feinheiten der Knochenstruktur, Muskeln, Sehnen und die Subtilitäten der Bewegung sind schwer zu erfassen und genau zu reproduzieren. Die KI muss diese Komplexität aus den Bildern in den Trainingsdaten „lernen“, was schwierig sein kann, besonders wenn die Datenmenge unzureichend ist.
Variabilität
Hände und Füße variieren stark in Größe, Form und Proportionen von Person zu Person. Die KI muss diese Variabilität lernen und dennoch konsistente, anatomisch korrekte Ergebnisse produzieren, was eine Herausforderung darstellt.
Generative Prozesse
Der generative Prozess selbst kann zu Fehlern führen. Die KI generiert Bilder nicht pixelweise, sondern erstellt sie aus abstrakten Konzepten, die sie dann in visuelle Darstellungen umwandelt. In diesem Prozess kann es zu Artefakten oder Fehlern kommen, die sich in der ungenauen Darstellung von Händen und Füßen manifestieren. Oft ist dies ein Nebenprodukt des Kompromisses zwischen der Geschwindigkeit des Bildgenerierungsprozesses und der Genauigkeit des Ergebnisses.
Prioritäten der Modelle
Die KI-Modelle könnten darauf trainiert worden sein, eher globale Merkmale eines Bildes zu erfassen, als feine Details wie die Anzahl der Finger. Das bedeutet, dass die Genauigkeit der Finger und Zehen möglicherweise nicht als Priorität im Trainingsprozess angesehen wurde.
Zusammenfassend lässt sich sagen, dass die Schwierigkeiten bei der Darstellung von Händen und Füßen auf eine Kombination aus Datenbeschränkungen, anatomischer Komplexität, der Natur des generativen Prozesses und den Prioritäten der Modellentwicklung zurückzuführen sind. Die Forschung und Entwicklung in diesem Bereich konzentriert sich darauf, diese Probleme durch verbesserte Trainingsdaten, verbesserte Algorithmen und eine gezieltere Optimierung der Modelle anzugehen.
Sie wundern sich über die Auswahl meiner KI-Bildgenerierung-Apps?
Ganz klar gibt es ausgezeichnete Vorreiter unter diesen Apps wie zum Beispiel Midjourney, SeaArt, Flux und andere. Leider sind viele davon nur mittels Kreditkarte nutzbar und da ich keine besitze, muss ich mich auf die konzentrieren zu denen ich Zugang habe. Sei es durch regulärem Kauf ohne Kreditkarte oder durch kostenlosen Zugang. SeaArt kann man zwar kostenlos nutzen, ist jedoch stark eingeschränkt bezüglich der Anzahl von Bildern die man pro Tag generieren kann.
Einen Leistungstest dieser „Profi“-Apps durchzuführen oder eine komplette Galerie zu erstellen ist mir somit nicht möglich. Und ja, Bilder die mit diesen Apps erstellt wurden sind wirklich der Hammer aber ich denke es liegt auch stark am Künstler selbst, wie gut seine Ergebnisse werden – auch mit weniger bekannten Txt2Img-KI-Apps.
Sind Sie mit meinem kostenlosen Service zufrieden?
Wenn Sie mir und so nebenbei, der ganzen Welt mitteilen möchten ob und wie Ihnen die Arbeit von und mit mir gefallen hat, hinterlassen Sie doch gerne Ihren Kommentar für andere Leser. Ich würde mich über konstruktive Kritik, Lob, Verbesserungsvorschläge wie auch neue Ideen von Ihnen, sehr freuen.
Viel Spaß beim Stöbern und Entdecken! Ihr Kurt Michael Treichl (KMT KI Media)
Gefällt dir dieser Beitrag?
Klicke auf einen Stern deiner Wahl um deine Wertung abzugeben!
Durchschnittliche Wertung: | Abgegebene Stimmen:
Noch nicht bewertet! Sei der Erste!
Diesen Beitrag teilen auf
Kurt Michael Treichl
Dieser Beitrag wurde von Kurt Michael Treichl (ehemals MAMA 4 Fans) erstellt. Ein wahrer Fan von KI-Anwendungsmöglichkeiten im Medienbereich. Er ist Gründer, Herausgeber, Inhaber und Verantwortlicher des von ihm geführten Labels "KMT KI Media" (seit 01.08.2024) auf der Mystic-Arts.com | Domaingründung: 23.10.2002