| inviato il 06 Dicembre 2024 ore 9:01
“ le ho dato in pasto Migrant mother di Dorothea Lange e devo dire che il risultato mi ha sorpreso molto, la potenza di questa AI mi lascia stupito „ Forse nel database dell'AI c'è un'intera collezione di foto molto famose che magari comprende quella che tu hai caricato. Potremmo inventare un nuovo QUIZ: indovinare la foto famosa a partire dalla descrizione dell'AI…. |
| inviato il 06 Dicembre 2024 ore 9:02
“ le ho dato in pasto Migrant mother di Dorothea Lange e devo dire che il risultato mi ha sorpreso molto, la potenza di questa AI mi lascia stupito „ @MatteoGroppi il meccanismo è incrementale e non per rovinare la magia ma è una cosa che esiste da tempo. la prima descrizione del prompt può anche essere tecnica ma poi la reiterazione parte da quella e tiene la reference sotto per cambiare il taglio e questo processo può essere reiterato più volte cambiando stile. questo modello addestrato è impostato per usare un linguaggio preso dalla letteratura che anch'io trovo bello. probabilmente è impostato per una decisione critica iniziale in base alla immagine proposta ed in base al soggetto sa già che tipo di risposta ci aspettiamo. |
| inviato il 06 Dicembre 2024 ore 9:08
si ma non ha un feedback, cioè se io do l'immagine lui la studia, se la ridò non ha avuto un check che gli dice che la risposta prima era buona o no quindi come migliora la risposta? ovvio che usa un Db ampio con più darti da confrontare però trova corrispondenze precise e il risultato è un'analisi precisa. Non ho mai parlato di magia, è chiaro che non hai letto il mio intervento precedente |
| inviato il 06 Dicembre 2024 ore 9:19
Davvero interessante. Ho provato a caricare un mio paesaggio urbano notturno e nell'analisi fatta dal programma oltre a qualche banalità c'erano alcuni spunti interessanti ai quali non avevo pensato. Ad esempio l'AI analizzando la diversa illuminazione delle case in alcune parti della foto ha ipotizzato un differente stile architettonico dovuto alla diversa età degli edifici. Un'altra cosa che mi ha stupito è stata la velocità di elaborazione, ci ha impiegato circa un secondo. |
| inviato il 06 Dicembre 2024 ore 9:22
Vi cito la prima parte dell'output tradotto uscito in risposta al caricamento di una foto famosissima che tutti riconoscerete. L'indicazione cosi precisa di Parigi, mi fa pensare ad un database che contenga le "mille" immagini più famose della storia della fotografia. Può essere? “ La fotografia, apparentemente scattata a Parigi, Francia, mostra una giovane coppia appassionata che si scambia un bacio in primo piano. Lo sfondo è pieno di attività, e mostra l'architettura di un grande edificio, forse un edificio governativo o un luogo di importanza storica. Le persone passeggiano tranquillamente, apparentemente indifferenti alla pubblica dimostrazione di affetto, le loro forme leggermente sfocate suggeriscono movimento. Diverse vecchie auto sono parcheggiate sulla strada, aggiungendo al contesto storico dell'immagine. Un uomo con un cappello scuro e un cappotto può essere visto all'estrema destra, la sua forma nascosta dalla folla. Quest'uomo sembra osservare la scena con una certa curiosità. „ |
user207727 | inviato il 06 Dicembre 2024 ore 9:26
No gente è allucinante. Gli ho dato alcune mie foto e mi ha veramente stupito. In quella del mio avatar ha detto che alla sx del soggetto c'è una vecchia presa elettrica che probabilmente necessita riparazione! |
| inviato il 06 Dicembre 2024 ore 9:53
Avviso ai naviganti. “ Le tue foto rivelano molte informazioni private. In questo esperimento, utilizziamo l' API Google Vision per estrarre la storia dietro una singola foto. „ Forse qualcosa, sotto-sotto, dovrebbe far pensare. cloud.google.com/vision |
| inviato il 06 Dicembre 2024 ore 10:28
@Perazzetta Ettore Questa cosa è notevole. O meglio, l'esistenza di servizi a pagamento (le API) da inserire nei propri codici è ormai diffusa e consolidata, pero' qui ti fanno una "ricetta" su misura, ritagliata sul tuo problema specifico, di tutto il flusso di lavoro, dall'inizio alla fine :-o Te la fa un'AI e poi, eventualmente, ti mettono in contatto con un esperto umano per concludere la cosa |
| inviato il 06 Dicembre 2024 ore 10:33
Quella che ho postato io in precedenza è abbastanza difficile da interpretare ma ci ha preso. |
| inviato il 06 Dicembre 2024 ore 12:56
Anche io ho l'impressione che alcune foto storiche cone Migrant Mother o il bacio di Doisneau in realtà siano le prime immagini che le siano state date in pasto e dunque siano "sue vecchie conoscenze". |
| inviato il 06 Dicembre 2024 ore 13:35
Pero' un modello AI, a differenza degli algoritmi deterministici classici di un computer, non contiene nessun database: si usa un database per addestrarlo, ma poi il modello viene salvato senza il database. L'AI si comporta, fatte le debite differenze, un po' come un cervello umano: se uno di noi ha visto nel corso della propria vita quadri di Banksy, vedendo uno dei suoi quadri probabilmente dirà qualcosa del tipo "questo sembra Banksy", senza necessariamente ricordare il nome esatto del quadro. Analogamente, l'AI potrebbe riportare il nome esatto del quadro (facendo magari una ricerca sul Web, come potremmo fare noi) oppure dire che la foto rappresentare un quadro nello stile di Banksy, anche se nel proprio dataset di addestramento quel quadro non c'era. Quanto al riconoscimento di Parigi, non ho visto la foto di cui si parla, ma se ci sono elementi distintivi famosi (la torre Eiffel, gli Champs-Elysees, etc) allora per l'AI è facile fare l'associazione. PS: visto ora: stiamo parlando del bacio di Doisneau? Se è cosi' non ci sono elementi architettonici particolari (a meno che l'edificio sullo sfondo non sia famoso, non saprei) ma forse l'AI ha colto dei pattern meno visibili: l'abbigliamento (quel basco)? le acconciature? le automobili? Molto interessante comunque |
| inviato il 06 Dicembre 2024 ore 15:05
quoto l'ultimo intervento: la AI NON lavora usando database, NON fa copia incolla di robe trovate o informazioni "memorizzate" da qualche parte. La "memoria" che ha e la modalità di "ricerca" è di tipo neurale, tale quale quella del cervello umano. Almeno come funzionamento. Gli errori delle prime AI sulla creazione delle immagini, altro non erano che "errori" di generazione fatta in base a connessioni neurali. Idem sta facendo adesso la AI con l'analisi di queste immagini: non va a cercare in rete se trova qualcosa, ma quello che leggiamo è un vero e proprio ragionamento, costruito allo stesso modo con cui lo costruisce il cervello, ossia basato su quello che "conosce" e sul numero di connessioni che può attivare nel farlo. |
| inviato il 06 Dicembre 2024 ore 15:27
Esatto, Angor, sottoscrivo. Le ultime AI, pero', sono multi-agent, oltre al loro modello addestrato possono usare anche altre risorse, ad esempio la navigazione Web. Lo fanno sistematicamente se gli chiedi notizie su eventi posteriori al loro dataset di addestramento. Ad esempio io ho chiesto a GPT chi ha vinto le elezioni USA e lui mi ha risposto correttamente Trump. Gli ho chiesto allora come fa a saperlo, dato che il suo dataset di training risale al 2023. Ecco cosa mi ha risposto: "I was able to provide the information about the 2024 U.S. presidential election because I used real-time browsing tools to gather the latest data. My training data is static and does not include events after October 2023, but with the ability to browse, I can retrieve and summarize current information for you. If you'd like, I can provide sources or further details about the election results!" Non so se il modello usato da Google per le immagini, quello di cui stiamo discutendo, fa altrettanto. |
| inviato il 06 Dicembre 2024 ore 15:40
Scusate, mi correggo parzialmente: i multi-agent sono una cosa leggermente diversa. Per essere precisi, la capacità di navigare il web e interrogare altre risorse va sotto il nome di retrieval-augmented generation (RAG), una caratteristica abbastanza recente dei sistemi come GPT. In teoria un'AI potrebbe anche interrogare un'altra AI per chiedere supporto su un certo argomento |
Che cosa ne pensi di questo argomento?Vuoi dire la tua? Per partecipare alla discussione iscriviti a JuzaPhoto, è semplice e gratuito!
Non solo: iscrivendoti potrai creare una tua pagina personale, pubblicare foto, ricevere commenti e sfruttare tutte le funzionalità di JuzaPhoto. Con oltre 251000 iscritti, c'è spazio per tutti, dal principiante al professionista. |

Metti la tua pubblicità su JuzaPhoto (info) |