JuzaPhoto utilizza cookies tecnici e cookies di terze parti per ottimizzare la navigazione e per rendere possibile il funzionamento della maggior parte delle pagine; ad esempio, è necessario l'utilizzo dei cookie per registarsi e fare il login (maggiori informazioni).
Proseguendo nella navigazione confermi di aver letto e accettato i Termini di utilizzo e Privacy e preso visione delle opzioni per la gestione dei cookie.
Puoi gestire in qualsiasi momento le tue preferenze cookie dalla pagina Preferenze Cookie, raggiugibile da qualsiasi pagina del sito tramite il link a fondo pagina, o direttamente tramite da qui:
Mi pare uno specchietto per le allodole (uno dei tanti) per fare in modo che molti regalino le loro foto…
Per stare sul concreto, sono interessanti quelle applicazioni di Google Vision che aiutano a taggare automaticamente le foto nel catalogo di Lightroom. Io uso AnyVision da diversi anni.
user207727
inviato il 05 Dicembre 2024 ore 8:38
Le ho dato in pasto una foto di d'Agata. Mi aspettavo la riconoscesse, invece l' ha descritta e basta, impressionante il finale.
Dovreste provare a caricarci la foto di un billo, bello duro e bello ritto, per vedere che cosa dice.
Siamo alla barzelletta, tristissima, di gente che di fotografia non ci capisce nulla e si fa aiutare da una stupidissima macchina per capirci qualcosa.
Gente che pende dalla "bocca", si fa per dire, di qualche circuito integrato che qualche furbo ha messo lì per farci dei quattrini, nulla è gratis.
Alla via così, tanto in "fotografia" oggi va bene tutto.
Sarebbe interessante allora confrontare, dico a Neogeo e non certo a Pollastrini, l'input testuale di partenza che ha prodotto l'immagine fornita all'AI in parola, con il responso di quest'ultima, per vedere se coincidono od ognuna interpreta la realtà a modo suo...
“ Sarebbe interessante allora confrontare, dico a Neogeo e non certo a Pollastrini, l'input testuale di partenza che ha prodotto l'immagine fornita all'AI in parola, con il responso di quest'ultima, per vedere se coincidono od ognuna interpreta la realtà a modo suo... „
Mi stupirebbe molto se lo facesse, anche perchè si tratta di due modelli generativi completamente diversi: uno, quello per la generazione di immagini sintetiche è un modello text-to-image, l'altro è un image-to-text. Mi aspetto quindi che le due cose siano completamente diverse.
Comunque modelli di questo tipo girano ormai tranquillamente anche in locale, se la GPU ha abbastanza memoria VRAM. Questo è un esempio con LLava 13b che gira su un SoC Nvidia da 2000 euro e 60 W:
alla fine del video c'è un'interpretazione più "artistica" del video, con la ragazza nel maneggio. Questa GPU Nvidia è meno potente di una 4060 ma ha molta più memoria (64 GB) e può caricare modelli che le GPU consumer non son oin grado di ospitare. E' notevole che ormai queste cose girino praticamente in tempo reale anche in locale e anche su hardware di basso costo. Di fatto si va verso applicazioni di robotica, dove la macchina sarà in grado di interpretare l'ambiente circostante e prender decisioni in tempo reale.
Credo che sfugga un punto: un software a cui si da in pasto n'immagine riesce a tirare fuori testi coerenti e anche abbastanza complessi per descrivere le immagini e questo alla portata praticamente di tutti. La cosa è abbastanza sorprendente perchè la complessità per sviluppare una cosa del genere è decisamente importante
Provate a fare la "backversion": fate analizzare la vostra foto alla AI poi prendete la descrizione ottenuta e la date in pasto alla intelligenza artificiale generativa per creare un'immagine. Ottenuta questa immagine ricominciate il ciclo, prendete l'immagine e la date in pasto all'AI per ottenere un'altra descrizione ecc.ecc. Dopo 5 reiterazioni del ciclo si confrontano l'ultima immagine ottenuta e l'ultima descrizione con quelle di partenza...
“ Credo che sfugga un punto: un software a cui si da in pasto n'immagine riesce a tirare fuori testi coerenti e anche abbastanza complessi per descrivere le immagini e questo alla portata praticamente di tutti. La cosa è abbastanza sorprendente perchè la complessità per sviluppare una cosa del genere è decisamente importante „
Sono d'accordo, non è una semplice descrizione come quelle di input
Che cosa ne pensi di questo argomento?
Vuoi dire la tua? Per partecipare alla discussione iscriviti a JuzaPhoto, è semplice e gratuito!
Non solo: iscrivendoti potrai creare una tua pagina personale, pubblicare foto, ricevere commenti e sfruttare tutte le funzionalità di JuzaPhoto. Con oltre 251000 iscritti, c'è spazio per tutti, dal principiante al professionista.