Mastodon
Zdjęcie okładkowe wpisu Apple udostępnia nowy model open-source SHARP

Apple udostępnia nowy model open-source SHARP

0
Dodane: 24 godziny temu

Apple udostępnia model open-source SHARP, który przekształca zdjęcia 2D w widoki 3D w ułamku sekundy.

Apple wprowadziło SHARP (Sharp Monocular View Synthesis in Less Than a Second) – model sztucznej inteligencji zdolny do fotorealistycznej rekonstrukcji sceny 3D z pojedynczego zdjęcia w mniej niż sekundę.

Najważniejsze informacje:

  • SHARP tworzy 3D Gaussian representation – miliony małych „kulek” światła i koloru odtwarzają scenę z zachowaniem rzeczywistej skali i proporcji.
  • Model działa w pojedynczym przebiegu sieci neuronowej na standardowej GPU, co pozwala na natychmiastowe renderowanie wysokiej jakości widoków z pobliskich punktów.
  • W odróżnieniu od tradycyjnych metod, SHARP nie wymaga wielu zdjęć tej samej sceny, wystarczy jedno zdjęcie.
  • Wyniki modelu pokazują 25–34% lepsze LPIPS i 21–43% lepsze DISTS w porównaniu z najlepszymi poprzednimi metodami, przy trzykrotnie szybszym czasie generowania.
  • Ograniczenie: model wiernie odwzorowuje bliskie punkty widoku, nie generuje całkowicie niewidocznych części sceny, co pozwala zachować szybkość i wiarygodność efektu.

 

Apple opublikowało SHARP na GitHub, umożliwiając użytkownikom testowanie i dzielenie się wynikami. Społeczność już prezentuje efekty działania modelu, w tym także kreatywne zastosowania wykraczające poza pierwotny zakres projektu.

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .