비디오와 이미지의 연속성이 부족해서 AI 업계의 고민이 깊었지만 다양하고 일관된 캐릭터 애니메이션을 만들 수 있게 해주는 혁신적인 기술이 스로리 디퓨전(story diffusion)에 의해 개발 될 예정입니다.
스토리 디퓨전은 consistent self-attention for long-range과 video generation이라는 두 가지 기술을 결합한 기술을 github에 발표했습니다. 이를 통해 캐릭터를 일관되게 유지하면서도 풍부한 스토리를 만들 수 있습니다. 아래의 카툰을 보시면 다른 ai 서비스와 달리 캐릭터가 한 공간안에서 다양한 행동을 취하는 등 놀랍도록 일관된 캐릭터가 생성된 것을 알 수가 있습니다.
더욱이 아래의 배포된 그림을 보시면 캐릭터 3명이 스토리에 개입되어 서로 다른 역활을 부여받았음에도 그 들이 확실히 구분되는 역활을 카툰 속에서 잘 소화해 주는 것을 볼 수 있습니다. 잘하고 있습니다.
consistent self-attention 기술은 아래 도표에 나타난 것처럼 캐릭터를 환경으로 부터 분리해내고 그 캐릭터의 행동을 전부다 분해해서 다시 조립하는 과정을 보여주고 있습니다. 그리하여 이미지와 비디오가 더욱 안정적으로 긴 시퀀스를 유지하면서 다양한 스토리를 만들어냅니다.
또 다른 하나는 motion predictor기술인데요, 이는 이미지 간의 연관성을 파악하고 부드러운 전환을 만들어서 일관된 비디오를 만들어냅니다. 이것으로 생성되는 이미지와 이미지를 연결한 비디오를 통제할 수 있게되는 것입니다.
이런 기술을 통해 마음에 드는 캐릭터와 스타일로 다양하고 일관된 애니메이션을 만들어낼 수 있습니다. 더욱이 캐릭터의 변화 없이도 풍부한 이야기를 표현할 수 있기 때문에 제작자들은 스토리에 집중할 수 있게 되었습니다.
스토리 디퓨전은 또한 다양한 캐릭터의 생성도 가능합니다. 여러 캐릭터의 정체성을 유지하면서 일관된 이미지를 생성할 수 있기 때문에 복잡한 시나리오나 다양한 캐릭터가 등장하는 스토리에도 적합합니다.
스토리 디퓨전은 애니메이션 제작뿐만 아니라 블로그나 유튜브 채널에서도 활용할 수 있습니다. 코믹 제작, 유튜브 동영상, 블로그 포스팅 등 여러분의 창작 활동에 새로운 가능성을 제공할 것으로 보입니다.
<이하 광고>
- 구글 GameNGen, 실시간으로 게임 환경을 생성하고 렌더링
- 메타, 코덱 아바타 프로젝트로 현실적인 디지털 아바타 생성
- AI 사업 아이디어 (13) : 개인 맞춤형 피트니스 서비스 개발 아이디어
- Ai 사업 아이디어 (12) : 내가 아는 ‘작은 지식’도 글로 쓰면 돈이 된다
- AI 칩 전쟁 (3) : 스핀 트랜지스터
- PC가 스마트 홈의 제어센터로 부족한 이유 8가지
- 사용자와 가전제품 사이에도 소통이 필요하죠 : 삼성 빅스비 AI
- AI가 인간처럼 사고하는 법 : RTNet 모델
- LLM은 현실을 어떻게 이해할까, 프루빙 기술로 들여다 보니
- AI 칩 전쟁 (2) : 그래프코어 IPU, 그래프 구조 최적화와 저지연 처리로 AI 연산 혁신
- AI 칩 전쟁 (1) : 웨이퍼 하나를 하나의 칩으로 사용하는 세레브라스의 혁신 전략
- 자동화 머신러닝(AutoML)으로 시민 데이터 과학자 시대
- MIT 연구진, 생성형 인공지능을 활용해 복잡한 물리학 문제에 답하다
- AI 사업 아이디어 (9) : 기업체로서 AI를 이용한 개인용 맞춤형 교육 플랫폼 운영
- 바이든-해리스 행정부, 2천만 달러 내걸고 인공지능 사이버 챌린지 출범
- 제철소 용광로에도 AI 기술이
- AI 이미지 판매 플랫폼들의 장단점
- 생성형 AI와 저작권 문제 : openAI와 뉴욕타임즈의 소송전
- EU의 AI 법, 중소 AI 기업엔 규제의 턱이 될 가능성이 높아
- POD(Print On Demand) 사이트를 운영하기 위한 AI 도구들
- AI 칩 전쟁 (3) : ‘디지털 딥러닝’을 뒤쫒는 ‘아나로그 딥러닝’기술
- 구글 AI 스튜디오, 프롬프트 갤러리 개설
- 혁신기업 ‘유니콘’ : 중국394, 한국13, 미국656 개
- 암호화폐 코인을 들고다니며 주인 대신 결제하는 AI : “skyfire”
- 인간 역할을 시작한 중국 가사도우미 로봇들
- 통상 20-30%의 지진예측율을 70%로 끌어올린 AI
- AI 데이터센터가 하나의 상품이 되는 시대
- 앤비디아의 ‘메카 브레이크’ 게임 : GPT4옴니로 말하는 NPC 등장
- 생성형 AI, 본격적으로 사업적 가치 창출 시작
- 앳지 데이터센터, 극한의 활용도로 각광
- AI 기업 분석 (1) : Palantir
- 로봇전투견, 우크라이나 전쟁터에서 실전경험 데이터 구축
- 마이크로 소프트, Maia 100 AI Accelerator, Cobalt 100 CPU
- 지구상의 ‘AI chip’ 전쟁
- 구글 Imagen 3 vs. 일론 머스크의 Grok AI
- AI 이미지 생성 속도 30배 향상 시스템 : DMD 모델
- 구글, 크롬캐스터에 제미나이를 심어 ‘Google TV Streamer’로 출시
- 회계 감사 업무에는 ‘RPA봇’
- 과학연구에도 AI비서가 필요한 시대, 사카나社의 ‘AI Scientist’
- 군집 AI에 꼭 필요한 역할분담 시스템 : LVWS
- 구글, 애플의 ‘시리’ 대항마로 ‘제미나이 라이브’ 전격 출시
- 노르웨이의 연어 양식에는 AI도 큰 일꾼
- 스승과 제자 AI가 대화하는 방식: DistillKit
- 자신이 한 행동을 평가하고 스스로 훈련하는 로봇 알고리즘 :EES
- MRI와 AI만 있으면 치매 진단 82% 성공, 캠브리지 대학 연구팀
- AI에 대해 공부하기 좋은 뉴스레터 15개
- 인공지능 기업이 커질 수록 중요해지는 수학 AI, 알리바바는 ‘Qwen2-Math’ 발표
- 축산업에 뛰어든 AI 기술
- Perplexity, 가시덤불 같은 저작권 문제부터 공략
- 농업회사도 AI 도입, 프랑스 Danone
- LLM의 신뢰도 유지에는 MIT 공대의 ‘Thermometer’기술을
- 라마,젬마, 미스트랄 보다 뛰어난 성능의 ‘LG EXAONE’
- 세상에서 가장 인기있는 AI WEB 사이트 50개
- 회의록 작성 전문 서기로 변신한 AI, 수요 폭증
- Gemini 1.5의 인기도, 기업들 채택 붐
- 기존의 약물 발견 방식을 가속화할 수 있는 새로운 계산 모델, ConPLex
- AI도 호기심을 먹고 산다, 성과를 높이는 최적의 균형 찾기
- AI로 망자의 아바타로 되살리는 중국 AI 기업
- 라마3.1 AI모델을 내 컴퓨터에 깔아보자
- 딥페이크 잡는 은하관측 기술, 영국 헐 대학교 연구진
- 비디오 프레임의 정보까지 추적하는 메타의 Segment Anything 2 (SAM2)
- AI의 기상 예보 혁신, 구글의 Metnet, GraphCast
- AI를 활용한 수학 교육과 응용의 혁신, 구글의 AlphaProof
- 운동선수의 신발 깔창에도 AI 기술을, Striv
- AI 모델을 통한 유관상피내암(DCIS) 단계 정밀 진단
- AMD, 온디바이스 AI 이미지 생성 모델 ‘어뮤즈 2.0’ 베타 출시
- MIT 연구진, AI로 MRSA(메티실린 저항성 황색포도상구균)에 대한 항생물질 발견
- Tenstorrent의 Wormhole AI 가속기: Jim Keller의 혁신과 NVIDIA와의 경쟁력 비교
- AI와 약물 개발, Amgen
- AI 뉴스 매체 7선
- ‘서치 GPT’와 ‘구글 AI 개요’의 전투 시작
- Klingai.com, 해외 유저용 사이트 오픈
- 마인크래프트를 통한 인공 지능의 공간 인식 개선 연구
- AI PC 전쟁에 나선 인텔, 엔비디아, AMD의 전략 비교
- 캐릭터 사이의 상호작용마저 자동으로 생성하는 ‘Show Runner’ 플랫폼
- 스마트 팩토리를 움직이는 ‘엣지 AI’
- 랜스 울라노프의 삼성 갤럭시 Z 폴드 6의 AI 기능 후기
- 사이버 보안 업체, ‘크라우드스트라이크’와 ‘팔로알토 네트웍스’
- AMD Ryzen AI 300 시리즈와 경쟁 AI 칩셋과의 비교
- 크로핀의 인공지능 농업솔루션, ‘Sage’
- 인공지능과 농압의 결합: 주목할만한 10개의 스타트업
- 마이크로 소프트의 ‘디자이너’와 ‘Canva’의 비교점
- 아이디어를 무진장 제공해주는 AI, Figma Jambot
- 스프레드 시트를 해석하고 생성하고 질문에 답하는 LLM
- 체조선수 처럼 기민하게, IHMC의 나디아 로봇
- 음악 선곡도 AI가 잘해요
- 구글 딥마인드, PEER 모델로 백만개 이상의 전문분야 라우팅
- 인공지능으로 휴먼 캐릭터 만들기, Hedra
- 살아있는 수많은 표정을 만드는 AI, ‘라이브 포트레이트’
- 엘지 유플러스의 AI
- 로파이(Lo-fi) 음악을 위한 Genmo.ai 에니메이션 제작법
- 웨어러블 AI의 미래, 갤럭시 링
- AI 로봇이 레시피 그대로, 1분만에 햄버거 뚝딱
- 신체 일부를 분리하고 재결합할 수 있는 소프트 로봇의 등장
- AI로 유투브용 음악생성 과정
- 생각 정리에는 ‘Whimsical’
- 암세포의 유전자 구조까지 살펴보는 AI, 바이옵티머스
- 백엔드와 서버 설정까지 해결해주는 아마존의 ‘앱스튜디오’
- 무법천지의 다크웹에도 AI 출동하는 보안기업, S2W
- 상표 등록도 AI가, 이노뱅크의 ‘TMAI’
- 생성 비디오 AI는 다모여, 드림플레어
- 달달한 챗봇 : Zeta AI
- 구글, 새로운 기계학습 방법론인 JEST 발표
- 개인용 로봇 시대가 오려나
- 웹툰 제작기 tootoon.ai
- 부산국제 인공지능 영화제..2024년 12월6일부터
- 프랑스 인공지능 연구소 큐타이와 음성 비서 ‘모시’의 탄생
- PPT 제작을 위한 AI 도구 활용
- 라이너 ‘학술 모드 AI 검색’ 베타 출시
- Runway의 Gen3, 다소 미흡하지만 우선 출발합니다
- 제디터로 상세페이지 고민 끝
- Websim.ai로 대부분의 프론트 엔드 서비스 생성 가능
- Figma AI로 PPT 제작을 단숨에
- 신규 AI 용어 풀이
- AI 건강 비서의 등장
- 의료 AI 분야에서 규제와 시장 진입의 어려움
- 리커션 파마슈티컬스의 혁신적 AI 기반 약물 발견 플랫폼과 최근 임상 성과
- 유디오아이, 새로운 브랜드 ‘메이크베스트뮤직’으로 새 출발
- 유머나 코미디 스크립트도 AI가 생성해 줄까요?
- AI 스티커 생성기, Filmora
- 코딩 특화 LLM의 부상
- 디스토피아의 눈동자: AI 챗봇과 소셜미디어의 융합
- 휴대용 초음파 기기에 AI를 접목, 버터플라이 IQ社
- 클로드 3.5 소네트를 이용한 만칼라 웹 앱 제작
- AI 웨어러블: 미래를 여는 기술
- 사이버 보안과 AI: SentinelOne
- Unleashing the Potential of Luma AI: Exploring Its Capabilities and Applications
- 인공지능 동영상 생성의 혁명 주자들: Sora, Runway Gen-3, 그리고 Luma의 DreamMachine
- 홈로봇은 AI 시대를 앞당기는 숨은 공신
- Shakker AI: 하드웨어 없이 Stable Diffusion을 경험할 수 있는 사이트
- AI 활용 디지털 자료 판매
- AI 데이터센터는 언제 계획을 세우나
- 일관된 이미지 생성에 특화된 AI, RenderNet
- 투자금융업과 AI
- 추모사업과 AI
- 탈모와 AI
- 동물의 소리 해석에 동원되는 AI 기술
- 동영상 편집의 전과정이 한 자리에 모인 인공지능 서비스, 필모라
- 라즈베리 파이(Raspberry Pi), 아두이노 제치고 온디바이스로
- 특허 업무에 차출된 AI, 젠아이피
- AI는 새로운 PC 몸체를 원합니다, AI PC
- 중국 AI 비디오 생성 기업 KLing, Sora에 도전장
- 가전에 심겨지는 AI 기술
- 전쟁 한 가운데에 징집된 AI 기술
- WAFOUR, 동영상의 일관성 문제 해결할 snowpea AI
- chatGPT, 잦은 먹통에 성장통
- AI 사업 아이디어 (29) : 건설 현장에서 맹활약 중인 AI… DL이엔씨
- 의료와 재난 상황에 깊숙이 투입되고 있는 AI
- FIFO-Diffusion 기술, 컨베이어 벨트방식으로 무한한 길이의 고품질 동영상 생성
- AI 생성 음악도 마켓팅이 필요하다
- 생성 AI로 경험해 보지 못한 무한대의 소리까지..가우디오랩
- 현재 우리나라 데이터 센터의 갯수 38개는 꼴찌수준입니다
- 요리하는데 도움주는 AI 사이트 5개
- 온프레미스와 오픈 소스는 AI 시대의 필수 전략
- LPDDR을 이용한 마하칩은 HBM을 따돌릴 수 있을까
- 로컬에서 AI 챗봇과 언어모델 실행을 위한 가이드
- chatGPT4옴니로 엑셀파일에 함수를 자유자재로 부리기
- 쇼셜미디어에서 쇼셜과 미디어가 분리되는 AI 시대에 더욱 커지는 콘텐츠 관리의 중요성
- 메타, GPT-4옴니에 필적할 LLM으로 ‘카멜레온’ 발표
- Runway로 움직이는 상품 이미지 만들어 마켓팅에 돌풍을!
- AI를 이해하기에 적절하며, 유용한 사이트 21개
- CCTV에 AI 도입시 고려 사항
- 구글, 유저들의 프픔프트 작성을 위한 안내 책자 배포
- 인공지능 시대에 더욱 커지는 ‘사람의 역할’, 비영리재단 퓨처 오브 라이프
- 구글의 저력, Sora에 필적할 Veo 방출
- 구글과 OpenAI 진영과의 숨막히는 대결…2024구글 IO
- 마인크래프트(Minecraft) 게임에도 자율 AI 에이전트 도입
- AI 시대의 이야기의 힘 : Storytelling이 왜 중요한가?
- URL만으로도 비디오 생성해주는 AI 사이트, 생성비디오 활용은 신중해야
- OpenAI의 GPT-4옴니, 인간처럼 보고 듣고 말하는 AI 비서
- Google, ‘AlphaFold 3’로 거의 모든 생물학적 분자 구조 예측 가능
- AI 생성음악을 MIDI 파일로 만들어 주는 ‘뮤지아 원’, 좋은 음악교육 도구
- Runway의 두 번째 AI 영화제: 과거와 미래를 잇는 예술의 장
- 소라, 700개 클립 생산해 한 개의 상업용 뮤직비디오 제작에 성공
- 생성AI의 일관성 유지기술 완성이 코앞에 다가왔다-Story Diffusion
- AI 뮤직비디오 걸작은 어디서 나올까, Noisee.ai에 가보세요
- 60개의 AI를 한눈에 서비스 하는 초강력 사이트, ‘POE.com’
- 만화에 진심인 Comic AI, Skyreels로 변경
- 제품과 서비스 홍보용 만화 그리기 좋은 AI 사이트-‘Wetoon’
- 구글의 VLOGGER-목소리와 사진 한장으로 나의 분신을 만든다
- chatGPT도 어도비와 같은 AI 그림 편집기능 도입
- 분실한 휴대폰 금방 찾는다, 구글의 ‘내 디바이스 찾기’
- AI와 블록체인: 코인광풍에 조심해야 할 키워드
- Nvidia, 지구의 기후변화에 대비하는 디지털 트윈 Earth-2 플랫폼 공개
- 메타버스와 AI: 로블록스의 혁신은 AI로 부터
- 애플, 혁신보다 개선에 초점을 맞춘 이미지-텍스트 기술 공개
- 미드저니, cref+url 문구삽입으로 캐릭터의 일관성 유지해
- chatGPT로 전력요금 계산하고 그래프로 보여주는 웹앱 만드는 방법
- chatGPT의 Dalle-3로 표현해보는 미술사조별 그림 스타일
- 텍스트 10만자를 일관성있는 웹툰으로 만들어버리는 AI..Lore Machine의 등장
- AI가 만드는 무한한 가상 세계: 구글 지니(GINIE)
- OpenAI, LLM으로 현실감 넘치는 동영상 생성하는 소라(Sora) 발표
- 페이크(Fake)에 속는 심리적 취약점 53가지
- AI 생성 콘텐츠와 실제 콘텐츠를 구별하는 10가지 방법
- 구글, 현실같은 AI 비디오 생성기 ‘루미에르(lumiere)’ 오픈
- 우리집 전기요금 얼마나 나올까, 요금계산 해보는 앱.
- 2024년 새해에는 4차 산업혁명의 폭발로 인구절벽 해결하자
- 한 해 국내 강력 범죄 발생 현황(2022)
- 2023.1-8월 국내 마약 사범 현황
- 위약금 장사
- 생존을 위해 압류를 차단하는 사례 모음
- 발렌타인데이에 보낼 소중한 e-card 제작
- 신년 e-card 보내기
- e-성탄카드를 직접 만드는 손쉬운 방법