Phorum.com.gr

Επειδή είχαμε μια μακριά συζήτηση σε κάποιο άλλο σημείο του φόρουμ και σε άλλο νήμα για το τι ακριβώς κάνει η εφαρμογή DALL-E, που υποτίθεται ότι δημιουργεί on the spot καινούργιες εικόνες με τρομερή πίστη στην περιγραφή που τις δίνεις (σε κείμενο), αποφάσισα να την δοκιμάσω. Αυτά είναι τα αποτελέσματα. Σε εισαγωγικά είναι η περιγραφή που έδωσα για να πάρω το κάθε αποτέλεσμα.

Για αρχή, είναι εξαιρετικά καλή στο να δημιουργεί πράγματα που είναι πολύ ξεκάθαρα δοσμένα, όπως αυτό το "lonely huge tree in a hill" (υπόψη ότι εν πολλοίς αγνοεί τις προθέσεις, που ήθελα να τεστάρω δίνοντας "in" αντί "on":

Αρχίζει να δυσκολεύεται όταν η περιγραφή έχει συνδυασμό πραγμάτων που απαιτούν ανάμειξη, όπως εδώ στο "the Greek parliament in flames", με αποτέλεσμα να μοιάζει με κακά γραφικά της δεκαετίας του '80. Δεν υπάρχει ανάμειξη χρωμάτων, καπνοί και τα ατμοσφαιρικά εφέ που θα περίμενε κανείς:

Της είναι μακράν πιο εύκολο να φτιάχνει ζωγραφιές, όπως αυτό το εδώ το αρκετά πετυχημένο "Alexis Tsipras riding a pony":

Ή αυτό το "horse telling jokes to the pope". Να σημειώσω εδώ ότι αυτό είναι μόνο ένα από τα 4-5 εναλλακτικά αποτελέσματα που βγάζει. Αυτό ήταν το πιο κοντινό σε άλογο. Οι υπόλοιπες εικόνες ήταν κανονικοί άνθρωποι με περίεργες μύτες.

Ενώ έχει την δυνατότητα φωτορεαλιστικής απεικόνισης, τα πράγματα είναι τραγικά όταν πρέπει να φιλοτεχνήσει πρόσωπα. Εδώ δύο παραλλαγές στο θέμα "gorgeous man". Απλά τραγικό.

Ενδιαφέρον παρουσιάζει πώς αντιλαμβάνεται τελείως ράντομ κόνσεπτ, όπως ονόματα εταιρειών. Εδώ έχουμε "Google kicking Microsoft". Οι παραλλαγές ήταν όλες στυλ κουνγκ φου αλλά με φωτορεαλιστικούς ανθρώπους αντί ζωγραφιές. Αυτή ήταν η πιο διασκεδαστική και πετυχημένη.

Κάπου εδώ αρχίζει και δείχνει τους περιορισμούς της η εφαρμογή και με ποιον τρόπο ζωγραφίζει. Στην πραγματικότητα αυτό που κάνει είναι ότι έχει πρόσβαση σε μια τεράστια βιβλιοθήκη με εικόνες ακι έχει εκπαιδευτεί να συσχετίζει συγκεκριμένα αντικείμενα με συγκεκριμένες λέξεις. Αυτός είναι ο λόγος που δεν κατάφερα σε καμμιά μου προσπάθεια να βρω μια πετυχημένη εικόνα για το "Japanese building in the middle of the ocean". Όπως φαίνεται σ' αυτήν την εικόνα και σε κάθε εικόνα που μου έδωσε το πρόγραμμα, υπάρχουν στο βάθος βουνά. Μάλιστα προσπάθησα και με "with no mountains" και διάφορες παραλλαγές και πάντα έβγαζε βουνά στο βάθος. Γιατί; Γιατί η ΑΙ έχει εκπαιδευτεί σε εικόνες που πάντα τα παραδοσιακά γιαπωνέζικα κτήρια είχαν στο βάθος βουνά, οπότε συσχέτισε το κόνσεπτ "japanese building" με αυτές τις βασικές γεωμετρικές παραμέτρους που περιλάμβανουν ορεινούς όγκους στο βάθος. Η ΑΙ ήταν μη ικανή να αντιληφθεί ότι αυτό δεν είναι μέρος του κόνσεπτ.

Και κάπου εδώ αρχίζει και γαμιέται το σύμπαν. Εδώ έχουμε "a pig eating an elephant". Δεν ξέρω τι ήπιε ο DALL-E πριν το σχεδιάσει, αλλά το αποτέλεσμα είναι τελείως αλλόκοτο.

Εκεί όμως που αποτυγχάνει οικτρά είναι στην απεικόνιση ατόμων, ειδικά αν είναι πάνω από 1-2. Εδώ έχουμε "fourteen men playing football". Αφενός είναι φανερό ότι δεν παίζουν, ποζάρουν. Αφετέρου δεν είναι 14. Είναι σαν κακό κολάζ με ασχημα κολλημένα περιγράμματα και τα πρόσωπα... τι να πω για τα πρόσωπα;

Κι εδώ βλέπουμε μια άλλη παραλλαγή του ίδιου θέματος. Εδώ υπάρχει δράση -με τους μη 14 άντρες- αλλά είναι λιγότερο ποδόσφαιρο και περισσότερο "η ανοιξιάτικη μέρα των ζωντανών νεκρών". Αυτό το ημίγυμνο εξάμβλωμα στα πόδια τους δεν έχω καταλάβει ακόμα τι είναι.

πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια

GreekGuy έγραψε: 23 Δεκ 2022, 23:33 πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια

Το δοκίμασα και μου έβγαζε πιάτα από φαγητά. Έτσι, στο ράντομ. Να δύο:

hellegennes έγραψε: 23 Δεκ 2022, 23:38
GreekGuy έγραψε: 23 Δεκ 2022, 23:33 πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια
Το δοκίμασα και μου έβγαζε πιάτα από φαγητά. Έτσι, στο ράντομ. Να δύο:

Σαν να σου λέει "είμαι καλοφαγού"

Πες της να ζωγραφίσει τον Θεό

Πλάκα έχει. Με τα ανθρώπινα πρόσωπα όντως δεν το έχει.

Two men and two women on a boat

An oil painting of a goat, a man and a dog

A Greek vase painting of computers

Το chatGTP - "Εικαστικές Τέχνες Edition".

Το μόνο καλό, έτσι χύμα που βγαίνουν τελευταία όλα αυτά τα προγράμματα, θα τα βαρεθεί πιο σύντομα ο κόσμος.

Καραμελίτσα έγραψε: 24 Δεκ 2022, 00:18 Πλάκα έχει. Με τα ανθρώπινα πρόσωπα όντως δεν το έχει.

Two men and two women on a boat

An oil painting of a goat, a man and a dog

A Greek vase painting of computers

Μπέσα, άμα είχα κονέ κανά σκηνοθέτη ταινιών τρόμου τύπου jumpscares /mockumentary (Paranormal Activity φάση) , θα του πρότεινα να χρησιμοποιήσει το πρόγραμμα για τα πρόσωπα των κακών, θα γλύτωνε τόσα λεφτά από το CGI.

Σαφώς καλύτερα αποτελέσματα δίνει το Hotpot. ΟΜΩΣ δεν είναι δωρεάν. Οι πρώτες δέκα εικόνες (ή κάπου τόσο) που θα φτιάξετε είναι δωρεάν μόνο. Εκεί γίνεται να επιλέξει κανείς και τεχνοτροπίες.

Παραδείγματα από εικόνες που το έχω βάλει να κάνει.

Στα πρόσωπα όμως, υπερέχει ξεκάθαρα. Του παραγγέλνω πορτραίτα για RPG

Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).

Το DALL-E επίτηδες δεν έχει εκπαιδευτεί να δίνει προσοχή σε πρόσωπα γι αυτό το αποτέλεσμα είναι συνήθως έτσι (και δεν το αδικώ γιατί μετά θα έβγαιναν οι κλασικοί ψεκ και θα άρχιζαν τις θεωρίες συνωμοσίας). Αντίθετα οι άνθρωποι δίνουν εκεί την μεγαλύτερη προσοχή όταν τα παρατηρούν σε σημείο που προσέχουμε ασυνείδητα τρελά μικροσκοπικές λεπτομέρειες. Ένας από τους λόγους που παρά την μεγάλη πρόοδο στα γραφικά είναι ακόμα όχι δύσκολο να ξεχωρίσεις φωτογραφία από 3d rendered scene είναι και αυτός.

Υπάρχουν και μερικές άλλες καλές όπως το Hotpot που πρότεινε ο AlienWay για πιο εξειδικευμένα πράγματα.

hellegennes έγραψε: 24 Δεκ 2022, 01:20 Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).

1ον: Σε όλες τις εφαρμογές τεχνητής νοημοσύνης, αξιοποιούνται ήδη υπάρχουσες εικόνες οι οποίες παραλλάσσονται. Άρα δεν ισχύει μόνο στη ζωγραφική που κάνουν, ισχύει σε όλα.
2ον: Αν στο hotpot βάλεις μια φωτο σου, διαλέξεις την τεχνοτροπία Game 1 (δηλαδή να φτιάξει πορτρέτο για game) και δώσεις μια παράμετρο π.χ. human barbarian, θα διαπιστώσεις ότι το αποτέλεσμα που θα λάβεις, δεν θα βασίζεται 100% στη φωτο που έδωσες (υπάρχει μάλιστα η πιθανότητα να μη σου μοιάζει). Αυτό συμβαίνει γιατί αυτές οι εφαρμογές συγχωνεύουν δεδομένα από πολλές εικόνες ώστε να δώσουν τη ζητούμενη εικόνα, με αποτέλεσμα τα όρια του κλόπυραιτ να γίνονται ρευστά.

Ο "μάγος" που έβαλα παραπάνω (human wizard ήταν η παράμετρος που έδωσα) βασίζεται εν μέρει σε φωτογραφία μιας δημοφιλούς περσόνας.

Awesomatic έγραψε: 24 Δεκ 2022, 01:37 Το DALL-E επίτηδες δεν έχει εκπαιδευτεί να δίνει προσοχή σε πρόσωπα γι αυτό το αποτέλεσμα είναι συνήθως έτσι (και δεν το αδικώ γιατί μετά θα έβγαιναν οι κλασικοί ψεκ και θα άρχιζαν τις θεωρίες συνωμοσίας). Αντίθετα οι άνθρωποι δίνουν εκεί την μεγαλύτερη προσοχή όταν τα παρατηρούν σε σημείο που προσέχουμε ασυνείδητα τρελά μικροσκοπικές λεπτομέρειες. Ένας από τους λόγους που παρά την μεγάλη πρόοδο στα γραφικά είναι ακόμα όχι δύσκολο να ξεχωρίσεις φωτογραφία από 3d rendered scene είναι και αυτός.

Πειραματίστηκα λίγο στην σελίδα του stablediffusionweb.com και ενώ το πρόβλημα στα πρόσωπα (ανθρώπων και ζώων) είναι σοβαρό και το αποτέλεσμα αποκρουστικό, δεν εστιάζεται αποκλειστικά εκεί. Θα περίμενες να καταλαβαίνει ότι ένα ζώο δεν μπορεί να έχει πολλές ουρές ή περισσότερα πόδια από το κανονικό, αλλά δεν ξέρω πως ακριβώς εκπαιδεύεται οπότε ίσως έχω υπερβολικές απαιτήσεις.

Γενικώς τα αποτελέσματα δεν ήταν ικανοποιητικά.

hellegennes έγραψε: 24 Δεκ 2022, 01:20 Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).

Δεν είμαι σίγουρος ότι κατάλαβα τι εννοείς. Αν δεν βαριέσαι, πες.

Phorum.com.gr

DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη