Discussion
Loading...

Post

  • About
  • Code of conduct
  • Privacy
  • About Bonfire
Krzysztof Kołacz
@KrzysztofKolacz@imagazine.pl  ·  activity timestamp yesterday

Apple udostępnia zestaw danych Pico-Banana-400K do trenowania modeli AI do edycji obrazów

Apple opublikowało nowy zestaw danych badawczych Pico-Banana-400K, zawierający 400 000 obrazów przeznaczonych do treningu modeli AI do edycji zdjęć.

Co ciekawe, dane zostały wygenerowane przy użyciu modeli Google Gemini-2.5.

Zbiór ma licencję badawczą (non-commercial) – można go używać wyłącznie do celów naukowych i rozwojowych. Celem projektu było stworzenie otwartego, wysokiej jakości zestawu danych, który pozwoli naukowcom rozwijać i testować modele AI do edycji zdjęć sterowane poleceniami tekstowymi.

Pico-Banana-400K obejmuje różne typy edycji, m.in. zmiany oświetlenia, pogody, pozycji obiektów, stylizacji postaci czy kadrowania. Dane powstały poprzez współpracę modeli Nano-Banana (Google) i Gemini-2.5-Pro, które generowały i weryfikowały jakość obrazów.

Apple liczy, że Pico-Banana-400K stanie się podstawą do szkolenia przyszłych modeli AI w dziedzinie edycji obrazu.

Więcej szczegółów w tym artykule.

Badanie znajdziecie na arXiv, a zbiór danych jest swobodnie dostępny na GitHub.

#AI #Apple #Apple2025 #AppleResearch #datasetAI #edycjaObrazów #Gemini25 #GoogleAI #PicoBanana400K #sztucznaInteligencja #treningModeliAI #uczenieMaszynowe

9to5Mac

Apple releases a curated AI dataset for image editing research - 9to5Mac

Apple has released Pico-Banana-400K, a 400,000-image research dataset which, interestingly, was built using Google’s Gemini-2.5 models.
arXiv.org

Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing

Recent advances in multimodal models have demonstrated remarkable text-guided image editing capabilities, with systems like GPT-4o and Nano-Banana setting new benchmarks. However, the research community's progress remains constrained by the absence of large-scale, high-quality, and openly accessible datasets built from real images. We introduce Pico-Banana-400K, a comprehensive 400K-image dataset for instruction-based image editing. Our dataset is constructed by leveraging Nano-Banana to generate diverse edit pairs from real photographs in the OpenImages collection. What distinguishes Pico-Banana-400K from previous synthetic datasets is our systematic approach to quality and diversity. We employ a fine-grained image editing taxonomy to ensure comprehensive coverage of edit types while maintaining precise content preservation and instruction faithfulness through MLLM-based quality scoring and careful curation. Beyond single turn editing, Pico-Banana-400K enables research into complex editing scenarios. The dataset includes three specialized subsets: (1) a 72K-example multi-turn collection for studying sequential editing, reasoning, and planning across consecutive modifications; (2) a 56K-example preference subset for alignment research and reward model training; and (3) paired long-short editing instructions for developing instruction rewriting and summarization capabilities. By providing this large-scale, high-quality, and task-rich resource, Pico-Banana-400K establishes a robust foundation for training and benchmarking the next generation of text-guided image editing models.
GitHub

GitHub - apple/pico-banana-400k

Contribute to apple/pico-banana-400k development by creating an account on GitHub.
Sorry, no caption provided by author
Sorry, no caption provided by author
Sorry, no caption provided by author
  • Copy link
  • Flag this post
  • Block
Log in

Encryptr.net Social

This is a forward thinking server running the Bonfire social media platform.

LGBTQA+ and BPOC friendly.

Encryptr.net Social: About · Code of conduct · Privacy ·
Encryptr.net social · 1.0.0-rc.2.33 no JS en
Automatic federation enabled
  • Explore
  • About
  • Code of Conduct
Home
Login