애플 뉴스

새로운 Apple AI 모델, 자연어 입력을 기반으로 이미지 편집

애플 연구진은 출시된 사용자의 자연어 명령을 기반으로 이미지를 편집할 수 있는 새로운 오픈 소스 AI 모델 벤처비트 ).





Apple Cash를 내 은행으로 어떻게 이체할 수 있어

DALL·E로 만든 MacRumors 이미지
MLLM-Guided Image Editing을 의미하는 'MGIE'라고 불리는 이 기능은 다중 모드 MLLM(대형 언어 모델)을 사용하여 사용자 요청을 해석하고 픽셀 수준 조작을 수행합니다.

모델은 이미지의 다양한 측면을 편집할 수 있습니다. 전반적인 사진 향상에는 밝기, 대비, 선명도 또는 스케치와 같은 예술적 효과 적용이 포함될 수 있습니다. 로컬 편집은 이미지의 특정 영역이나 개체의 모양, 크기, 색상 또는 질감을 수정할 수 있는 반면, Photoshop 스타일 수정에는 자르기, 크기 조정, 회전, 필터 추가, 심지어 배경 변경 및 이미지 혼합도 포함될 수 있습니다.



피자 사진에 대한 사용자 입력은 '좀 더 건강해 보이게 만드는 것'일 수 있습니다. 상식적인 추론을 사용하여 모델은 토마토, 허브 등의 야채 토핑을 추가할 수 있습니다. 전역 최적화 입력 요청은 '더 많은 빛을 시뮬레이션하기 위해 대비 추가' 형식을 취할 수 있는 반면, Photoshop 스타일 수정은 사진 배경에서 사람을 제거하고 이미지의 초점을 배경으로 이동하도록 모델에 요청하여 이루어질 수 있습니다. 대상자의 표정.

Apple은 캘리포니아 대학교 연구진과 협력하여 MGIE를 만들었습니다. 종이 ICLR(International Conference on Learning Representation) 2024에서. 이 모델은 GitHub에서 사용할 수 있으며 코드, 데이터 및 사전 훈련된 모델을 포함합니다.


이는 몇 달 만에 Apple이 AI 연구에서 두 번째로 획기적인 성과를 거둔 것입니다. 12월 말, Apple은 iPhone 및 메모리가 제한된 기타 Apple 장치에 LLM(대형 언어 모델)을 배포하는 데 진전을 이루었다고 밝혔습니다. 혁신적인 플래시 메모리 활용 기술 .

지난 몇 달 동안 Apple은 ChatGPT와 경쟁할 수 있는 'Apple GPT' 경쟁 제품을 테스트해 왔습니다. 에 따르면 블룸버그 의 Mark Gurman은 AI 작업이 Apple의 최우선 과제이며 Apple은 대규모 언어 모델을 위한 'Ajax' 프레임워크를 설계하고 있다고 말했습니다.

Apple Watch를 강제로 재설정하는 방법

둘 다 정보 분석가 Jeff Pu는 Apple이 iPhone 및 iPad에서 일종의 생성 AI 기능을 사용할 수 있을 것이라고 주장합니다. 2024년 말쯤 , iOS 18이 나올 때입니다. iOS 18에는 다음이 포함되어 있다고 합니다. 향상된 버전의 Siri ChatGPT와 유사한 생성 AI 기능을 갖추고 있으며 iPhone 역사상 '가장 큰' 소프트웨어 업데이트가 될 가능성이 있습니다. 구르만에 따르면 .