Η OpenAI αποκαλύπτει το DALL-E 3. Η εφαρμογή Τεχνητής Νοημοσύνης για την παραγωγή εικόνων πλέον ενώνει τις δυνάμεις της με το ChatGPT!
Η τελευταία έκδοση του μοντέλου αξιοποιεί το GPT για να διευκολύνει τη δημιουργία πολύπλοκων και συνεκτικών εικόνων. Η OpenAI, η εταιρεία πίσω από το βασικό GPT, μόλις αποκάλυψε την ολοκαίνουργια έκδοση DALL-E 3. Και αυτή τη φορά, είναι η εικόνα που βρίσκεται ξανά στο προσκήνιο.
H τρίτη έκδοση της γεννήτριας εικόνων DALL-E υπόσχεται περισσότερη απόχρωση, λεπτομέρεια και πολυπλοκότητα. Το πρώτο σημείο που προτάθηκε από την OpenAI είναι η ακρίβεια των προτροπών. Ακόμη και οι καλύτερες αντίστοιχες εφαρμογές, όπως το Midjourney ή το DreamStudio, υποφέρουν από ένα κοινό πρόβλημα: τείνουν να αγνοούν ορισμένες λέξεις στο ερώτημα κειμένου. Για να επιτύχετε τα καλύτερα αποτελέσματα, πρέπει επομένως να μάθετε εμπειρικά να επικοινωνείτε με τον αλγόριθμο. Αυτό περιλαμβάνει πολλές δοκιμές λεξιλογίου και εκφράσεων για να βρεθούν εκείνες που είναι πιο πιθανό να ερμηνευθούν σωστά. Αυτή είναι μια άσκηση που μπορεί να είναι δύσκολη όταν ο χρήστης αναμένει ένα πολύ συγκεκριμένο αποτέλεσμα, εξ ου και ο όρος «πρότυπη μηχανική».
Το ChatGPT χρησιμοποιείται για τη σύνταξη προτροπών
Με το DALL-E 3, η OpenAI θέλει να βάλει τέλος σε αυτήν την κατάσταση πραγμάτων. «Τα σύγχρονα συστήματα μετατροπής κειμένου σε εικόνα τείνουν να αγνοούν λέξεις ή περιγραφές, κάτι που εκπαιδεύει τον χρήστη να μάθει άμεση μηχανική. Το DALL-E 3 αντιπροσωπεύει ένα μεγάλο βήμα προς τα εμπρός στην ικανότητά μας να παράγουμε εικόνες που προσκολλώνται ακριβώς στο παρεχόμενο κείμενο», λέει η εταιρεία.
Και για να γίνει αυτό, η εταιρεία έχει ήδη το τέλειο εργαλείο: το ChatGPT! Η νέα έκδοση του μοντέλου 3 είναι «εγγενώς χτισμένη» γύρω από το chatbot. Τώρα λειτουργεί ως ενδιάμεσος για να ερμηνεύσει κάθε λεπτομέρεια του αιτήματος. Το μοντέλο γλώσσας μπορεί επίσης να βοηθήσει τον χρήστη να δημιουργήσει εξαιρετικά λεπτομερείς προτροπές, έτσι ώστε το DALL-E να κατανοεί ακριβώς τι αναμένεται από αυτό χωρίς να καταφύγει σε προηγμένες τεχνικές άμεσης μηχανικής.
Και αν το αρχικό αποτέλεσμα δεν είναι κατάλληλο, δεν πειράζει. Το μόνο που έχετε να κάνετε είναι να περάσετε ξανά από το ChatGPT για να ζητήσετε συγκεκριμένες αλλαγές όσον αφορά το χρώμα, το σχήμα, το στυλ, μια συγκεκριμένη λεπτομέρεια… Με άλλα λόγια, η OpenAI έχει τραβήξει όλα τα στάδια για να προσφέρει μέγιστο βαθμό ελέγχου με ένα ελάχιστο προσπάθειας και τεχνικής εξειδίκευσης. Στα παραδείγματα που προτείνει η OpenAI, σημειώνουμε επίσης ότι το DALL-E 3 είναι ικανό να δημιουργεί συνεκτικά κείμενα. Αυτό είναι κάτι που οι γεννήτριες εικόνων είχαν πρόβλημα να κάνουν μέχρι πρότινος. Για παράδειγμα, η τελευταία έκδοση του Midjourney εξακολουθεί να παράγει αρκετά… εξωτικά αποτελέσματα.
Προστασία δημοσίων προσώπων
Η εταιρεία έχει, ωστόσο, επιβάλει συγκεκριμένο όρια. Οι μηχανικοί έχουν ενοποιήσει τις διασφαλίσεις που υπάρχουν ήδη στο DALL-E και στο DALL-E 2 που εμποδίζουν τον χρήστη να δημιουργήσει περιεχόμενο βίας, πορνογραφικό υλικό και ρητορική μίσους.
Επιπλέον, το DALL-E 3 έχει σχεδιαστεί έτσι ώστε να απορρίπτει ερωτήματα που αναφέρουν ρητά ένα δημόσιο πρόσωπο. Στόχος είναι να αποτραπεί η χρήση του για σκοπούς προπαγάνδας ή παραπληροφόρησης.
Σεβασμός της πνευματικής ιδιοκτησίας
Το άλλο σημαντικό σημείο αυτής της ενημέρωσης είναι ότι η OpenAI φαίνεται να έχει λάβει υπόψη τις πολυάριθμες επικρίσεις που έχουν απευθυνθεί στους διάφορους παραγωγούς εικόνων σχετικά με την πνευματική ιδιοκτησία. Από εδώ και πέρα, το DALL-E θα αρνείται αιτήματα που του ζητούν να μιμηθεί το στυλ ενός ζωντανού καλλιτέχνη. Αυτό θα κλείσει την πόρτα σε πολλές απόπειρες παραποίησης/απομίμησης.
Από την άλλη πλευρά, αυτό το σύστημα προστασίας θα είναι σίγουρα ατελές. Η ακρίβεια αυτής της τρίτης έκδοσης είναι ένα δίκοπο μαχαίρι. Θεωρητικά, ένας αρκετά οξυδερκής χρήστης θα είναι πάντα σε θέση να επιτύχει ένα αρκετά κοντινό αποτέλεσμα. Θα πρέπει απλώς να είστε σε θέση να περιγράψετε το στυλ του εν λόγω καλλιτέχνη με μεγάλη ακρίβεια χωρίς να τον ονομάσετε ρητά.
Ως ελάχιστη δικλείδα ασφαλείας, η OpenAI προσφέρει δύο λύσεις που επιτρέπουν σε έναν καλλιτέχνη να αρνηθεί να χρησιμοποιήσει τη δουλειά του για την εκπαίδευση του DALL-E. Το πρώτο είναι να συμπληρώσει μια σχετική φόρμα. Αλλά αν θέλετε να προστατέψετε έναν μεγάλο αριθμό από αυτά, όπως αυτά που διατηρείτε στο διαδικτυακό σας χαρτοφυλάκιο, το ιδανικό είναι να απαγορεύσετε την πρόσβαση στο πρόγραμμα ανίχνευσης GPTBot.
Αυτό θα περιορίσει σημαντικά την ικανότητα του DALL-E 3 να μιμείται τα εν λόγω έργα. Με την προϋπόθεση όμως ότι δεν έχουν ήδη ενσωματωθεί στο μοντέλο. Και αυτό είναι δυστυχώς αδύνατο να προσδιοριστεί στην πράξη, αφού τα δεδομένα πηγής δεν διατηρούνται μετά την ενσωμάτωση στο μοντέλο.
Το DALL-E3 θα κυκλοφορήσει επίσημα τον ερχόμενο Οκτώβριο για τους πελάτες των προσφορών ChatGPT Plus και ChatGPT Enterprise.
-----------
Μπορεί να λάβουμε ένα μικρό ποσοστό εάν κάνετε κλικ σε έναν σύνδεσμο και αγοράσετε κάποιο προϊόν. Για περισσότερες λεπτομέρειες, εδώ μπορείτε να μάθετε πώς χρησιμοποιούμε τους συνδέσμους συνεργατών. Σας ευχαριστούμε για την υποστήριξη.
-----------
Ακολουθήστε το Gizchina Greece στο Google News για νέα και ειδήσεις στον χώρο της τεχνολογίας. Αν ψάχνετε HOT προσφορές και κουπόνια για κινητά και gadgets, κάντε εγγραφή στο κανάλι μας στο Telegram.
-----------