Σελίδα 1 από 2

DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 23 Δεκ 2022, 23:28
από hellegennes
Επειδή είχαμε μια μακριά συζήτηση σε κάποιο άλλο σημείο του φόρουμ και σε άλλο νήμα για το τι ακριβώς κάνει η εφαρμογή DALL-E, που υποτίθεται ότι δημιουργεί on the spot καινούργιες εικόνες με τρομερή πίστη στην περιγραφή που τις δίνεις (σε κείμενο), αποφάσισα να την δοκιμάσω. Αυτά είναι τα αποτελέσματα. Σε εισαγωγικά είναι η περιγραφή που έδωσα για να πάρω το κάθε αποτέλεσμα.


Για αρχή, είναι εξαιρετικά καλή στο να δημιουργεί πράγματα που είναι πολύ ξεκάθαρα δοσμένα, όπως αυτό το "lonely huge tree in a hill" (υπόψη ότι εν πολλοίς αγνοεί τις προθέσεις, που ήθελα να τεστάρω δίνοντας "in" αντί "on":

Εικόνα


Αρχίζει να δυσκολεύεται όταν η περιγραφή έχει συνδυασμό πραγμάτων που απαιτούν ανάμειξη, όπως εδώ στο "the Greek parliament in flames", με αποτέλεσμα να μοιάζει με κακά γραφικά της δεκαετίας του '80. Δεν υπάρχει ανάμειξη χρωμάτων, καπνοί και τα ατμοσφαιρικά εφέ που θα περίμενε κανείς:

Εικόνα


Της είναι μακράν πιο εύκολο να φτιάχνει ζωγραφιές, όπως αυτό το εδώ το αρκετά πετυχημένο "Alexis Tsipras riding a pony":

Εικόνα


Ή αυτό το "horse telling jokes to the pope". Να σημειώσω εδώ ότι αυτό είναι μόνο ένα από τα 4-5 εναλλακτικά αποτελέσματα που βγάζει. Αυτό ήταν το πιο κοντινό σε άλογο. Οι υπόλοιπες εικόνες ήταν κανονικοί άνθρωποι με περίεργες μύτες.

Εικόνα


Ενώ έχει την δυνατότητα φωτορεαλιστικής απεικόνισης, τα πράγματα είναι τραγικά όταν πρέπει να φιλοτεχνήσει πρόσωπα. Εδώ δύο παραλλαγές στο θέμα "gorgeous man". Απλά τραγικό.

Εικόνα

Εικόνα


Ενδιαφέρον παρουσιάζει πώς αντιλαμβάνεται τελείως ράντομ κόνσεπτ, όπως ονόματα εταιρειών. Εδώ έχουμε "Google kicking Microsoft". Οι παραλλαγές ήταν όλες στυλ κουνγκ φου αλλά με φωτορεαλιστικούς ανθρώπους αντί ζωγραφιές. Αυτή ήταν η πιο διασκεδαστική και πετυχημένη.

Εικόνα


Κάπου εδώ αρχίζει και δείχνει τους περιορισμούς της η εφαρμογή και με ποιον τρόπο ζωγραφίζει. Στην πραγματικότητα αυτό που κάνει είναι ότι έχει πρόσβαση σε μια τεράστια βιβλιοθήκη με εικόνες ακι έχει εκπαιδευτεί να συσχετίζει συγκεκριμένα αντικείμενα με συγκεκριμένες λέξεις. Αυτός είναι ο λόγος που δεν κατάφερα σε καμμιά μου προσπάθεια να βρω μια πετυχημένη εικόνα για το "Japanese building in the middle of the ocean". Όπως φαίνεται σ' αυτήν την εικόνα και σε κάθε εικόνα που μου έδωσε το πρόγραμμα, υπάρχουν στο βάθος βουνά. Μάλιστα προσπάθησα και με "with no mountains" και διάφορες παραλλαγές και πάντα έβγαζε βουνά στο βάθος. Γιατί; Γιατί η ΑΙ έχει εκπαιδευτεί σε εικόνες που πάντα τα παραδοσιακά γιαπωνέζικα κτήρια είχαν στο βάθος βουνά, οπότε συσχέτισε το κόνσεπτ "japanese building" με αυτές τις βασικές γεωμετρικές παραμέτρους που περιλάμβανουν ορεινούς όγκους στο βάθος. Η ΑΙ ήταν μη ικανή να αντιληφθεί ότι αυτό δεν είναι μέρος του κόνσεπτ.

Εικόνα

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 23 Δεκ 2022, 23:31
από hellegennes
Και κάπου εδώ αρχίζει και γαμιέται το σύμπαν. Εδώ έχουμε "a pig eating an elephant". Δεν ξέρω τι ήπιε ο DALL-E πριν το σχεδιάσει, αλλά το αποτέλεσμα είναι τελείως αλλόκοτο.

Εικόνα


Εκεί όμως που αποτυγχάνει οικτρά είναι στην απεικόνιση ατόμων, ειδικά αν είναι πάνω από 1-2. Εδώ έχουμε "fourteen men playing football". Αφενός είναι φανερό ότι δεν παίζουν, ποζάρουν. Αφετέρου δεν είναι 14. Είναι σαν κακό κολάζ με ασχημα κολλημένα περιγράμματα και τα πρόσωπα... τι να πω για τα πρόσωπα;

Εικόνα


Κι εδώ βλέπουμε μια άλλη παραλλαγή του ίδιου θέματος. Εδώ υπάρχει δράση -με τους μη 14 άντρες- αλλά είναι λιγότερο ποδόσφαιρο και περισσότερο "η ανοιξιάτικη μέρα των ζωντανών νεκρών". Αυτό το ημίγυμνο εξάμβλωμα στα πόδια τους δεν έχω καταλάβει ακόμα τι είναι.

Εικόνα

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 23 Δεκ 2022, 23:33
από GreekGuy
πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια :smt005:

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 23 Δεκ 2022, 23:38
από hellegennes
GreekGuy έγραψε: 23 Δεκ 2022, 23:33 πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια :smt005:
Το δοκίμασα και μου έβγαζε πιάτα από φαγητά. Έτσι, στο ράντομ. Να δύο:


Εικόνα

Εικόνα

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 23 Δεκ 2022, 23:44
από GreekGuy
hellegennes έγραψε: 23 Δεκ 2022, 23:38
GreekGuy έγραψε: 23 Δεκ 2022, 23:33 πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια :smt005:
Το δοκίμασα και μου έβγαζε πιάτα από φαγητά. Έτσι, στο ράντομ. Να δύο:


Εικόνα

Εικόνα
Σαν να σου λέει "είμαι καλοφαγού" :003: :003:

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 24 Δεκ 2022, 00:02
από GreekGuy
Πες της να ζωγραφίσει τον Θεό

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 24 Δεκ 2022, 00:18
από Καραμελίτσα
Πλάκα έχει. Με τα ανθρώπινα πρόσωπα όντως δεν το έχει.

Two men and two women on a boat


Εικόνα


An oil painting of a goat, a man and a dog


Εικόνα


A Greek vase painting of computers


Εικόνα

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 24 Δεκ 2022, 00:30
από Imperium
Το chatGTP - "Εικαστικές Τέχνες Edition".

Το μόνο καλό, έτσι χύμα που βγαίνουν τελευταία όλα αυτά τα προγράμματα, θα τα βαρεθεί πιο σύντομα ο κόσμος.

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 24 Δεκ 2022, 00:39
από GreekGuy
Καραμελίτσα έγραψε: 24 Δεκ 2022, 00:18 Πλάκα έχει. Με τα ανθρώπινα πρόσωπα όντως δεν το έχει.

Two men and two women on a boat


Εικόνα


An oil painting of a goat, a man and a dog


Εικόνα


A Greek vase painting of computers


Εικόνα
Μπέσα, άμα είχα κονέ κανά σκηνοθέτη ταινιών τρόμου τύπου jumpscares /mockumentary (Paranormal Activity φάση) , θα του πρότεινα να χρησιμοποιήσει το πρόγραμμα για τα πρόσωπα των κακών, θα γλύτωνε τόσα λεφτά από το CGI.

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 24 Δεκ 2022, 00:42
από AlienWay
Σαφώς καλύτερα αποτελέσματα δίνει το Hotpot. ΟΜΩΣ δεν είναι δωρεάν. Οι πρώτες δέκα εικόνες (ή κάπου τόσο) που θα φτιάξετε είναι δωρεάν μόνο. Εκεί γίνεται να επιλέξει κανείς και τεχνοτροπίες.

Παραδείγματα από εικόνες που το έχω βάλει να κάνει.


Εικόνα



Εικόνα

Στα πρόσωπα όμως, υπερέχει ξεκάθαρα. Του παραγγέλνω πορτραίτα για RPG



Εικόνα



Εικόνα


Εικόνα

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 24 Δεκ 2022, 01:20
από hellegennes
Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 24 Δεκ 2022, 01:37
από Awesomatic
Το DALL-E επίτηδες δεν έχει εκπαιδευτεί να δίνει προσοχή σε πρόσωπα γι αυτό το αποτέλεσμα είναι συνήθως έτσι (και δεν το αδικώ γιατί μετά θα έβγαιναν οι κλασικοί ψεκ και θα άρχιζαν τις θεωρίες συνωμοσίας). Αντίθετα οι άνθρωποι δίνουν εκεί την μεγαλύτερη προσοχή όταν τα παρατηρούν σε σημείο που προσέχουμε ασυνείδητα τρελά μικροσκοπικές λεπτομέρειες. Ένας από τους λόγους που παρά την μεγάλη πρόοδο στα γραφικά είναι ακόμα όχι δύσκολο να ξεχωρίσεις φωτογραφία από 3d rendered scene είναι και αυτός.

Υπάρχουν και μερικές άλλες καλές όπως το Hotpot που πρότεινε ο AlienWay για πιο εξειδικευμένα πράγματα.

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 24 Δεκ 2022, 10:31
από AlienWay
hellegennes έγραψε: 24 Δεκ 2022, 01:20 Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).
1ον: Σε όλες τις εφαρμογές τεχνητής νοημοσύνης, αξιοποιούνται ήδη υπάρχουσες εικόνες οι οποίες παραλλάσσονται. Άρα δεν ισχύει μόνο στη ζωγραφική που κάνουν, ισχύει σε όλα.
2ον: Αν στο hotpot βάλεις μια φωτο σου, διαλέξεις την τεχνοτροπία Game 1 (δηλαδή να φτιάξει πορτρέτο για game) και δώσεις μια παράμετρο π.χ. human barbarian, θα διαπιστώσεις ότι το αποτέλεσμα που θα λάβεις, δεν θα βασίζεται 100% στη φωτο που έδωσες (υπάρχει μάλιστα η πιθανότητα να μη σου μοιάζει). Αυτό συμβαίνει γιατί αυτές οι εφαρμογές συγχωνεύουν δεδομένα από πολλές εικόνες ώστε να δώσουν τη ζητούμενη εικόνα, με αποτέλεσμα τα όρια του κλόπυραιτ να γίνονται ρευστά.

Ο "μάγος" που έβαλα παραπάνω (human wizard ήταν η παράμετρος που έδωσα) βασίζεται εν μέρει σε φωτογραφία μιας δημοφιλούς περσόνας.

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 26 Δεκ 2022, 01:55
από ST48410
Awesomatic έγραψε: 24 Δεκ 2022, 01:37 Το DALL-E επίτηδες δεν έχει εκπαιδευτεί να δίνει προσοχή σε πρόσωπα γι αυτό το αποτέλεσμα είναι συνήθως έτσι (και δεν το αδικώ γιατί μετά θα έβγαιναν οι κλασικοί ψεκ και θα άρχιζαν τις θεωρίες συνωμοσίας). Αντίθετα οι άνθρωποι δίνουν εκεί την μεγαλύτερη προσοχή όταν τα παρατηρούν σε σημείο που προσέχουμε ασυνείδητα τρελά μικροσκοπικές λεπτομέρειες. Ένας από τους λόγους που παρά την μεγάλη πρόοδο στα γραφικά είναι ακόμα όχι δύσκολο να ξεχωρίσεις φωτογραφία από 3d rendered scene είναι και αυτός.
Πειραματίστηκα λίγο στην σελίδα του stablediffusionweb.com και ενώ το πρόβλημα στα πρόσωπα (ανθρώπων και ζώων) είναι σοβαρό και το αποτέλεσμα αποκρουστικό, δεν εστιάζεται αποκλειστικά εκεί. Θα περίμενες να καταλαβαίνει ότι ένα ζώο δεν μπορεί να έχει πολλές ουρές ή περισσότερα πόδια από το κανονικό, αλλά δεν ξέρω πως ακριβώς εκπαιδεύεται οπότε ίσως έχω υπερβολικές απαιτήσεις.

Γενικώς τα αποτελέσματα δεν ήταν ικανοποιητικά.

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Δημοσιεύτηκε: 26 Δεκ 2022, 01:59
από ST48410
hellegennes έγραψε: 24 Δεκ 2022, 01:20 Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).
Δεν είμαι σίγουρος ότι κατάλαβα τι εννοείς. Αν δεν βαριέσαι, πες.