RCE Foto

(i) Per navigare su JuzaPhoto, è consigliato disabilitare gli adblocker (perchè?)






Login LogoutIscriviti a JuzaPhoto!
JuzaPhoto utilizza cookies tecnici e cookies di terze parti per ottimizzare la navigazione e per rendere possibile il funzionamento della maggior parte delle pagine; ad esempio, è necessario l'utilizzo dei cookie per registarsi e fare il login (maggiori informazioni).

Proseguendo nella navigazione confermi di aver letto e accettato i Termini di utilizzo e Privacy e preso visione delle opzioni per la gestione dei cookie.

OK, confermo


Puoi gestire in qualsiasi momento le tue preferenze cookie dalla pagina Preferenze Cookie, raggiugibile da qualsiasi pagina del sito tramite il link a fondo pagina, o direttamente tramite da qui:

Accetta CookiePersonalizzaRifiuta Cookie

l' AI analizza le nostre foto


  1. Forum
  2. »
  3. Tema Libero
  4. » l' AI analizza le nostre foto





avatarsenior
inviato il 06 Dicembre 2024 ore 9:01

le ho dato in pasto Migrant mother di Dorothea Lange e devo dire che il risultato mi ha sorpreso molto, la potenza di questa AI mi lascia stupito


Forse nel database dell'AI c'è un'intera collezione di foto molto famose che magari comprende quella che tu hai caricato.

Potremmo inventare un nuovo QUIZ: indovinare la foto famosa a partire dalla descrizione dell'AI…. MrGreen

avatarsenior
inviato il 06 Dicembre 2024 ore 9:02

le ho dato in pasto Migrant mother di Dorothea Lange e devo dire che il risultato mi ha sorpreso molto, la potenza di questa AI mi lascia stupito

@MatteoGroppi

il meccanismo è incrementale e non per rovinare la magia ma è una cosa che esiste da tempo.
la prima descrizione del prompt può anche essere tecnica ma poi la reiterazione parte da quella e tiene la reference sotto per cambiare il taglio e questo processo può essere reiterato più volte cambiando stile.

questo modello addestrato è impostato per usare un linguaggio preso dalla letteratura che anch'io trovo bello.
probabilmente è impostato per una decisione critica iniziale in base alla immagine proposta ed in base al soggetto sa già che tipo di risposta ci aspettiamo.

avatarsenior
inviato il 06 Dicembre 2024 ore 9:08

si ma non ha un feedback, cioè se io do l'immagine lui la studia, se la ridò non ha avuto un check che gli dice che la risposta prima era buona o no quindi come migliora la risposta?
ovvio che usa un Db ampio con più darti da confrontare però trova corrispondenze precise e il risultato è un'analisi precisa.
Non ho mai parlato di magia, è chiaro che non hai letto il mio intervento precedente

avatarsenior
inviato il 06 Dicembre 2024 ore 9:18

Ho provato a far "leggere" questa mia immagine
www.juzaphoto.com/galleria.php?t=4910385&l=it
e il risultato è consono all'intento iniziale.

avatarsenior
inviato il 06 Dicembre 2024 ore 9:19

Davvero interessante. Ho provato a caricare un mio paesaggio urbano notturno e nell'analisi fatta dal programma oltre a qualche banalità c'erano alcuni spunti interessanti ai quali non avevo pensato. Ad esempio l'AI analizzando la diversa illuminazione delle case in alcune parti della foto ha ipotizzato un differente stile architettonico dovuto alla diversa età degli edifici. Un'altra cosa che mi ha stupito è stata la velocità di elaborazione, ci ha impiegato circa un secondo.

avatarsenior
inviato il 06 Dicembre 2024 ore 9:22

Vi cito la prima parte dell'output tradotto uscito in risposta al caricamento di una foto famosissima che tutti riconoscerete.

L'indicazione cosi precisa di Parigi, mi fa pensare ad un database che contenga le "mille" immagini più famose della storia della fotografia.
Può essere?


La fotografia, apparentemente scattata a Parigi, Francia, mostra una giovane coppia appassionata che si scambia un bacio in primo piano. Lo sfondo è pieno di attività, e mostra l'architettura di un grande edificio, forse un edificio governativo o un luogo di importanza storica. Le persone passeggiano tranquillamente, apparentemente indifferenti alla pubblica dimostrazione di affetto, le loro forme leggermente sfocate suggeriscono movimento. Diverse vecchie auto sono parcheggiate sulla strada, aggiungendo al contesto storico dell'immagine. Un uomo con un cappello scuro e un cappotto può essere visto all'estrema destra, la sua forma nascosta dalla folla. Quest'uomo sembra osservare la scena con una certa curiosità.

user207727
avatar
inviato il 06 Dicembre 2024 ore 9:26

No gente è allucinante. Gli ho dato alcune mie foto e mi ha veramente stupito.

In quella del mio avatar ha detto che alla sx del soggetto c'è una vecchia presa elettrica che probabilmente necessita riparazione! :-P

avatarsenior
inviato il 06 Dicembre 2024 ore 9:53

Avviso ai naviganti.

Le tue foto rivelano molte informazioni private.
In questo esperimento, utilizziamo l' API Google Vision per estrarre la storia dietro una singola foto.


Forse qualcosa, sotto-sotto, dovrebbe far pensare.

cloud.google.com/vision

avatarsenior
inviato il 06 Dicembre 2024 ore 10:28

@Perazzetta Ettore
Questa cosa è notevole. O meglio, l'esistenza di servizi a pagamento (le API) da inserire nei propri codici è ormai diffusa e consolidata, pero' qui ti fanno una "ricetta" su misura, ritagliata sul tuo problema specifico, di tutto il flusso di lavoro, dall'inizio alla fine :-o
Te la fa un'AI e poi, eventualmente, ti mettono in contatto con un esperto umano per concludere la cosa

avatarsenior
inviato il 06 Dicembre 2024 ore 10:33

Quella che ho postato io in precedenza è abbastanza difficile da interpretare ma ci ha preso. Eeeek!!!

avatarsenior
inviato il 06 Dicembre 2024 ore 12:56

Anche io ho l'impressione che alcune foto storiche cone Migrant Mother o il bacio di Doisneau in realtà siano le prime immagini che le siano state date in pasto e dunque siano "sue vecchie conoscenze".

avatarsenior
inviato il 06 Dicembre 2024 ore 13:35

Pero' un modello AI, a differenza degli algoritmi deterministici classici di un computer, non contiene nessun database: si usa un database per addestrarlo, ma poi il modello viene salvato senza il database. L'AI si comporta, fatte le debite differenze, un po' come un cervello umano: se uno di noi ha visto nel corso della propria vita quadri di Banksy, vedendo uno dei suoi quadri probabilmente dirà qualcosa del tipo "questo sembra Banksy", senza necessariamente ricordare il nome esatto del quadro. Analogamente, l'AI potrebbe riportare il nome esatto del quadro (facendo magari una ricerca sul Web, come potremmo fare noi) oppure dire che la foto rappresentare un quadro nello stile di Banksy, anche se nel proprio dataset di addestramento quel quadro non c'era.
Quanto al riconoscimento di Parigi, non ho visto la foto di cui si parla, ma se ci sono elementi distintivi famosi (la torre Eiffel, gli Champs-Elysees, etc) allora per l'AI è facile fare l'associazione.

PS: visto ora: stiamo parlando del bacio di Doisneau? Se è cosi' non ci sono elementi architettonici particolari (a meno che l'edificio sullo sfondo non sia famoso, non saprei) ma forse l'AI ha colto dei pattern meno visibili: l'abbigliamento (quel basco)? le acconciature? le automobili? Molto interessante comunque

avatarsenior
inviato il 06 Dicembre 2024 ore 15:05

quoto l'ultimo intervento: la AI NON lavora usando database, NON fa copia incolla di robe trovate o informazioni "memorizzate" da qualche parte.
La "memoria" che ha e la modalità di "ricerca" è di tipo neurale, tale quale quella del cervello umano. Almeno come funzionamento.
Gli errori delle prime AI sulla creazione delle immagini, altro non erano che "errori" di generazione fatta in base a connessioni neurali.

Idem sta facendo adesso la AI con l'analisi di queste immagini: non va a cercare in rete se trova qualcosa, ma quello che leggiamo è un vero e proprio ragionamento, costruito allo stesso modo con cui lo costruisce il cervello, ossia basato su quello che "conosce" e sul numero di connessioni che può attivare nel farlo.


avatarsenior
inviato il 06 Dicembre 2024 ore 15:27

Esatto, Angor, sottoscrivo.
Le ultime AI, pero', sono multi-agent, oltre al loro modello addestrato possono usare anche altre risorse, ad esempio la navigazione Web. Lo fanno sistematicamente se gli chiedi notizie su eventi posteriori al loro dataset di addestramento. Ad esempio io ho chiesto a GPT chi ha vinto le elezioni USA e lui mi ha risposto correttamente Trump. Gli ho chiesto allora come fa a saperlo, dato che il suo dataset di training risale al 2023. Ecco cosa mi ha risposto:
"I was able to provide the information about the 2024 U.S. presidential election because I used real-time browsing tools to gather the latest data. My training data is static and does not include events after October 2023, but with the ability to browse, I can retrieve and summarize current information for you. If you'd like, I can provide sources or further details about the election results!"
Non so se il modello usato da Google per le immagini, quello di cui stiamo discutendo, fa altrettanto.

avatarsenior
inviato il 06 Dicembre 2024 ore 15:40

Scusate, mi correggo parzialmente: i multi-agent sono una cosa leggermente diversa. Per essere precisi, la capacità di navigare il web e interrogare altre risorse va sotto il nome di retrieval-augmented generation (RAG), una caratteristica abbastanza recente dei sistemi come GPT.

In teoria un'AI potrebbe anche interrogare un'altra AI per chiedere supporto su un certo argomento Cool

Che cosa ne pensi di questo argomento?


Vuoi dire la tua? Per partecipare alla discussione iscriviti a JuzaPhoto, è semplice e gratuito!

Non solo: iscrivendoti potrai creare una tua pagina personale, pubblicare foto, ricevere commenti e sfruttare tutte le funzionalità di JuzaPhoto. Con oltre 251000 iscritti, c'è spazio per tutti, dal principiante al professionista.






Metti la tua pubblicità su JuzaPhoto (info)


 ^

JuzaPhoto contiene link affiliati Amazon ed Ebay e riceve una commissione in caso di acquisto attraverso link affiliati.

Versione per smartphone - juza.ea@gmail.com - Termini di utilizzo e Privacy - Preferenze Cookie - P. IVA 01501900334 - REA 167997- PEC juzaphoto@pec.it

www.juzaphoto.com - www.autoelettrica101.it

Possa la Bellezza Essere Ovunque Attorno a Me