https://www.youtube.com/watch?v=_Ysmm7jMTxs
description: |-
1. 이건 꼭 알아야 한다[^1]
[? 질문] 영상 생성 AI Seedance 2.0(시덴스 2.0)이 왜 “영상계 나노바나 모먼트/딥시크 모먼트”라고 불릴 정도로 충격을 주는가[^2]
[= 답] 단순히 “그럴듯한 한 컷”이 아니라 움직임(모션), 장면 전환, 서사 흐름, 실사/애니 변환, 소리까지 자연스럽게 만들면서 유저들이 만든 결과물이 대규모로 바이럴되고, 광고·영상·애니 업계의 제작 방식 자체를 흔들 수준으로 보이기 때문이다.[^2][^3][^4]
[? 질문] 2025년 이후 AI 발전이 “큰 거 온다(something big is happening)”는 불안을 실제로 뒷받침하는 근거는 무엇인가[^5]
[= 답] 모델 성능이 가파르게 상승하며 **AI가 수행 가능한 작업량(예: 5.2 기준 6.6시간 작업)**이 커지고, 그 결과 웹사이트·iOS 앱·깃허브 코드·숏폼 콘텐츠까지 생산이 폭발하고 있으며, 1~5년 내 법률·금융·의료·소프트웨어 등 “컴퓨터로 하는 일” 전반에서 직무 구조 변화가 현실화될 수 있다는 관측이 나오기 때문이다.[^6][^7][^8]
[? 질문] 최신 AI 뉴스의 핵심 흐름은 무엇인가(코딩/연구/오픈소스/로봇/AI 컴패니언까지)[^9]
[= 답] (1) 초고속 추론(GPT-5.3 Codex Spark)으로 코딩 생산성이 더 빨라지고,[^10][^11] (2) 과학/연구 특화 모델(예: Gemini 3 Deep Think)이 벤치마크에서 압도적 수치를 보이며,[^12][^13] (3) GLM-5 같은 대형 오픈소스가 성능을 끌어올려 폐쇄형과 격차를 좁히고,[^14][^15] (4) 음성/상담 에이전트, TTS 오픈소스, “AI 여자친구(Clawra)” 같은 소비자 제품이 빠르게 등장하며,[^16][^17] (5) 휴머노이드 로봇의 손·보행·동작이 급진적으로 발전하는 모습이 동시에 나타난다는 것이다.[^18][^19]
2. 큰 그림[^1]
이 콘텐츠는 한 주(또는 최근)의 AI 업계에서 “지금 당장 체감되는 변화”를 보여주는 사례들을 모아, 영상 생성부터 코딩·연구·오픈소스·음성 에이전트·AI 컴패니언·휴머노이드 로봇까지의 동시다발적 진전을 소개한다.[^2][^10][^18] 특히 “딸깍”이라는 표현으로 요약되는 생산 단가의 급락과 제작 속도의 급등이 산업과 직무를 어떻게 재편할지에 초점을 둔다.[^7][^8][^9]
- Seedance 2.0이 영상/애니/광고 제작을 “자연스러운 모션+서사+사운드” 수준으로 끌어올리며 업계 저작권·사용금지 논란까지 촉발한다.[^2][^4][^20]
- 초고속 추론 모델(GPT-5.3 Codex Spark)과 연구 특화 모델(Gemini 3 Deep Think)이 코딩·과학 문제 해결 속도를 더 올리고, 벤치마크 수치로 그 격차를 과시한다.[^10][^11][^12]
- 오픈소스(오픈 웨이트) 진영의 약진(GLM-5 등)과 음성/TTS/AI 컴패니언/로봇의 진화가 맞물리며 “AI 전환기”가 현실로 다가오고 있음을 체감 사례로 보여준다.[^14][^16][^18]
3. 하나씩 살펴보기[^1]
3.1 Seedance 2.0의 바이럴: “영상계 나노바나 모먼트”[^2]
영상은 시작부터 Seedance 2.0(시덴스 2.0)이 점점 더 많은 사용자에게 풀리며, 결과물이 “엄청나게 바이럴”되고 있다고 말한다.[^2] 화자는 이를 과거 이미지 생성에서의 “나노바나” 같은 혁신적 순간에 빗대어, 영상 영역에서도 비슷한 충격(“영상계 나노바나 모먼트 혹은 딥시크 모먼트”)으로 불린다고 설명한다.[^2]
이어서 실제로 유저들이 만든 “재밌는 영상” 사례가 많다고 전제하고, 영상 생성 분야에선 일종의 벤치마크 밈이 있다고 언급한다.[^3] 그 벤치마크가 바로 “윌 스미스가 스파게티를 얼마나 잘 먹느냐” 같은 초기 AI 영상의 상징적 테스트라는 것이다.[^3]
또한 사용자 제작물 예시로 “드래곤볼 실사판”을 보여주며, 화면이 “편집실에서 찍은 것 같다”는 반응이 나올 정도로 그럴싸하다고 말한다.[^4] 여기서 핵심은 단지 인물/장면이 그럴듯한 수준을 넘어, 소리(오디오)까지 잘 나온다는 점을 강조하는 흐름으로 이어진다.[^4]
3.2 만화/애니 기반 영상화: 장면 재현, B급 감성, 그리고 “딸깍 애니메이션”[^4]
화자는 드래곤볼 팬이라면 알아볼 “어떤 장면”을 실제 만화 기반으로 영상화한 사례를 언급하면서, 만화 원작을 영상으로 옮기는 품질이 상당하다고 말한다.[^4] 이어 “B급 감성의 영화라면 이런 식으로 나올 것 같다”는 표현으로, 질감/연출 톤까지 제어된 듯한 결과물을 설명한다.[^4]
구체 예시로는 다음 같은 “상상 프롬프트”급 장면들이 언급된다.
- “루피가 선니오에서 맥북으로 코딩하다가 격분해서 바다에 던져버리는 장면” 같은 만화적 설정도 영상으로 뽑아낼 수 있다고 말한다.[^4]
- “나루토 실사화” 같은 예시도 자연스럽게 나오며, 만화 기반 애니메이션화(혹은 실사화)가 매우 자연스럽다고 평가한다.[^4]
이 과정에서 화자는 소리의 자연스러움에 다시 감탄하며, “이거 그냥 만드는 애니메이션 아닌가?”라는 반응이 나올 정도라고 전한다.[^4] 나아가 “이제는 만화 기반으로 딸깍딸깍하면 애니메이션이 이런 식으로 나오지 않을까?”라는 전망을 던진다.[^4]
3.3 모션(움직임) 품질과 모션 디자인 혁신 주장[^4]
영상은 농구 장면 예시를 들어 “움직임이 굉장히 자연스럽다”, “거의 직접 찍은 것 같다”고 말하며 모션의 품질을 강조한다.[^4] 그리고 Seedance 2.0이 모션 디자인 분야까지 혁신했다고 소개한다.[^4]
여기서 화자는 “실제 카메라가 할 수 있는 것보다 훨씬 더 발전돼 있다”, “카메라로 찍느니 AI 딸각이 더 잘 나온다”는 식의 과감한 표현을 사용한다.[^4] 즉 촬영/특수효과/카메라 무빙을 AI가 더 쉽게, 더 그럴싸하게 만들어버리는 장면을 상정한다.[^4]
또한 “기존에 움직임이 있으면” 그 위에 애니메이션 캐릭터를 삽입해 실사↔애니 변환을 자연스럽게 할 수 있고, 치마/머리카락 같은 디테일 움직임도 자연스럽다고 설명한다.[^4]
결론적으로 “실사화를 한다고 하면 굳이 새로 안 찍어도 될 것 같다”, “애니메이션 기반으로 AI 딸깍딸깍하면 되지 않을까?”라는 제작 패러다임 전환을 제기한다.[^4]
3.4 광고 제작의 ‘딸깍화’와 채널 내 서비스 홍보[^4]
화자는 광고 시장에도 변화가 올 수 있다고 말한다.[^4] 예를 들어 UGC(사용자 제작 콘텐츠) 제품 기반 광고를 AI로 만들 수 있고, 실제로 인플루언서가 말하는 듯한 광고 영상이 자연스럽게 생성되는 느낌을 보여준다.[^4]
이어 “인플루언서한테 안 맡겨도 이런 영상들 그냥 나올 수가 있겠다”는 취지로 말하며, 자신의 광고 제작 서비스(“io로 들어오시면… 3분이면 완성”)를 짧게 홍보한다.[^4] 다만 아직 Seedance 2.0 API가 안 풀려 있어서, API가 풀리면 적용하겠다고 덧붙인다.[^4]
[!NOTE] 제작/사업 관점 포인트
영상 생성 모델의 API 제공 여부가 곧바로 “자동 광고 제작” 같은 제품 기능으로 연결될 수 있음을, 본인 서비스 로드맵(Seedance API 연동 예정) 형태로 보여준다.[^4]
3.5 성적 이미지 논란·점유율 급등·할리우드의 반발(저작권 이슈)로 번지는 Seedance 2.0[^20]
화자는 트위터에서 유명하게 돌아다니는 사례를 보여주며, Grok(그록)의 과거 논란처럼 “이미지가 너무 잘 나오니까 성적 이미지 논란”이 생기고, 그 이후 미국 점유율이 “1년 전 9배로 늘었다”는 이야기를 언급한다.[^20] 그리고 이런 현상이 단순 밈이 아니라 “천만 해(해시태그/조회)” 급으로 유행 중이라고 말한다.[^20] (표현상 정확한 단위는 구어체로 전달되지만, 핵심은 규모가 매우 크다는 주장이다.)[^20]
이어 “두 줄짜리 프롬프트”로 화려한 액션 신이 생성되는 사례를 언급하며 “할리우드가 망했다”는 말까지 나온다고 전한다.[^20] 이때부터 영상은 산업의 위기의식과 제도권의 반응(사용 중지·금지 요구)으로 넘어간다.[^20]
구체적으로 다음과 같은 반응이 소개된다.
- “배우 연합”과 “MPA(미국 영화 협회)” 등에서 Seedance 2.0이 위험하니 쓰지 말라는 식의 성명이 나온다고 말한다.[^20]
- “우리 거 저작권 가져가고 있다”는 문제 제기가 핵심이라고 정리한다.[^20]
- 디즈니가 사용 중지 및 금지 명령서(cease and desist)를 보냈다는 이야기를 전하며, 스타워즈/마블 같은 IP도 “딸깍하면 바로” 나와버리는 상황이 저작권 측면에서 큰 문제가 되고 있다고 말한다.[^20]
- 중국까지 이 영향이 미칠지에 대해 “중국이 마음대로 해버리면 방법이 있나?”라는 식의 의문도 던진다.[^20]
또한 기사들이 쏟아지고 있으며 “할리우드는 새로운 Seedance 2.0 비디오 생성기에 불만”이라는 보도 흐름을 언급한다.[^20] 급한 대로 “정지” 조치가 이뤄지고 있고, “저작권 침해가 명확한 것들은 카피 오너에 의해 정제됐다”는 식의 조치도 언급한다.[^20]
3.6 Seedance 2.0 vs Kling 3.0 비교: ‘서사/흐름’의 차이[^21]
화자는 Seedance 2.0이 얼마나 좋은지를 보여주기 위해 Kling 3.0과의 비교 영상을 언급한다.[^21]
- Seedance 2.0은 “흐름이나 서사”가 잘 담긴다고 평가한다.[^21]
- Kling 3.0은 장면의 인과/동선이 “약간 안 맞는다”고 지적하며, 예로 “자동차는 뒤에서 오는데 여기서 점프하고 있다”처럼 맥락이 어긋난 상황을 든다.[^21]
결론적으로 Seedance가 “서사를 부여”하거나 “장면이 더 그럴싸하게” 만드는 데 강점이 있다고 정리한다.[^21]
3.7 Seedance 2.0 실제 사용 경로·가격, 그리고 조코딩의 생성 실험[^22]
화자는 Seedance 2.0을 실제로 쓸 수 있느냐는 질문에 “지금 풀리고 있다”고 말한다.[^22] 사용처로 “미티i(발음상)”라는 곳을 언급하며, 다만 요금제가 “129달러 월간”이고, “크로 이상” 플랜을 써야 한다고 말한다.[^22] 그리고 “여러분을 위해서 질렀다”며 직접 결제해 돌렸다고 한다.[^22]
직접 돌린 예시로는:
- 오징어 게임에 자신의 사진을 넣어 생성해봤고 “영화처럼 잘 나온다”고 말한다.[^22]
- 자신의 사진을 드래곤볼 장면에 넣어 “고쿠랑 싸우는 장면”을 만들었다고 한다.[^22]
- “지미 팰런 쇼에 조코딩이 출연한다면” 같은 콘셉트도 만든다.[^22]
- “루피”와 싸우는 장면에서, 자신을 “조코딩”이라고 했더니 “01로 된 바이너리 방패”로 루피 주먹을 막는 디테일이 나온다고 말한다.[^22]
- “이말년 시리즈” 만화를 넣어 짧은 만화를 실사화/애니메이션화해보며, 대사와 소리까지 자연스럽다고 강조한다.[^22]
이 실험 파트는 결과물의 “그럴싸함”을 반복적으로 강조하며, 특히 소리(음성/효과)의 자연스러움을 재차 확인하는 흐름이다.[^22]
마지막엔 “큰일 났다”, “영화·영상·애니메이션 업계는 거의 끝나지 않았나?” 같은 강한 표현으로, 업계 충격을 감정적으로 마무리한다.[^23]
3.8 “Something big is happening”: 8,200만 뷰의 ‘계시’와 직무 재편 경고[^5]
화자는 하이퍼라이트 AI 대표이자 AI 업계 영향력 인물로 소개되는 “매추머”가 “something big is happening”이라는 글을 썼고, 그 글이 “8,200만 뷰”가 넘었다고 말한다.[^5] 그리고 그 메시지에 동의하며 “거대한 무언가가 일어나고 있다”고 강조한다.[^5]
글의 요지로 전달되는 내용은 다음과 같다.
- 2025년 이후 AI 모델 발전 속도가 급격히 가속화되고 있으며, 기술 내부(업계)에서는 이미 직무 구조 변화가 현실화되었다.[^6]
- “자기 강화 루프”가 형성되어, 법률·금융·의료·소프트웨어 등 화면 기반 지식노동(컴퓨터로 하는 일)은 1~5년 내 대규모 재편 가능성이 있다.[^6]
- 지금은 두려움보다 “조기 적응과 실전 활용”이 가장 큰 우위이며, 향후 2~5년이 구조적 전환기가 될 수 있음을 강조한다.[^6]
화자는 이 글이 화제가 된 이유를 “다들 느끼고 있기 때문”이라고 해석한다.[^6] 뉴스/영상을 보는 시청자들도 “뭔가 일어나고 있다”고 느끼는데, 그 감각을 글로 잘 풀어 폭발적으로 확산됐다는 설명이다.[^6]
3.9 AI가 수행 가능한 ‘작업량’ 증가(5.2 기준 6.6시간)와 생산 폭발 지표들[^7]
화자는 “작업 속도가 얼마나 빨리 올라가고 있냐”는 관점에서, AI가 할 수 있는 작업량이 가파르게 증가하고 있다고 말한다.[^7] 구체 수치로 “5.2 기준 약 6.6시간 분량의 작업”을 할 수 있고, 이는 “지금까지 보고된 가장 높은 수치”라고 설명한다.[^7]
이어서 생산성 폭발의 징후로 여러 현상을 나열한다.[^8]
- 새로운 웹사이트가 “어마어마하게 빠르게 증가”한다.[^8]
- iOS 앱 출시도 매우 빠르게 상승한다(“iOS 앱도 그냥 딸깍하면 나와버리죠”).[^8]
- 깃허브 코드도 “엄청나게 증가”한다.[^8]
- 결과적으로 생산성이 “폭발적으로 극대화”되었다고 말한다.[^8]
화자는 “그럴 수밖에 없”는 이유를 “그냥 딸깍하면 다 나와 버리니까, 안 만들 이유가 없다”로 정리한다.[^8]
3.10 콘텐츠 공장화: AI 영상 150개 계정 도배, 월소득 3.7만 달러, 인스타 피드가 AI로 가득[^9]
코딩/생산성뿐 아니라 영상 쪽도 난리라는 연결로, 한 크리에이터가 틱톡 계정 150개에 AI 생성 영상을 도배하기 위해 인턴 3명을 쓰고, 월소득이 37,000달러라는 사례를 든다.[^9] 이는 콘텐츠 생산이 “공장 딸깍”으로 가능해졌다는 맥락이다.[^9]
화자는 이를 “이제는 분량의 시대”라고 표현한다.[^9] 공장식으로 대량 생산해 그중 일부가 성공하며 알고리즘을 타는 전략이 더 중요해졌다는 취지다.[^9]
이어 인스타그램을 넘기면 “다 AI 영상밖에 없다”, 스크롤 할 때마다 AI라는 식으로 체감 묘사를 길게 이어간다.[^9] 결론적으로 “광고를 제외한 모든 영상은 AI로 제작되었다”는 식의 문장으로, 피드가 AI 콘텐츠로 압도되는 상황을 강조한다.[^9]
3.11 GPT-5.3 Codex Spark: 셀레브라스 협업, 웨이퍼 스케일 칩 기반 ‘초고속 추론’[^10]
화자는 “끝이 아니다”라며 GPT-5.3 Codex Spark의 출시를 소개한다.[^10] 이전에 셀레브라스(Cerebras)와의 협업을 소개했었다고 회상하며, 셀레브라스가 무엇인지 설명한다.[^10]
- 셀레브라스는 “웨이퍼 스케일 칩”을 사용해 추론을 빠르게 하는, “추론 전문 칩 스타트업”이라고 설명한다.[^10]
- 이 협업으로 “굉장히 빠른 고속 추론”이 가능한 GPT-5.3 Codex Spark 모델이 나왔고, 이를 이용하면 “굉장히 빠르게 코딩”할 수 있다고 말한다.[^10]
- Codex에서 “실시간 코딩”을 진행할 수 있다는 식으로 활용상을 말한다.[^10]
3.12 Codex Spark 속도 비교 데모: 10초 만에 게임 플레이 vs 아직 생성 중[^11]
화자는 “얼마나 빠른가”를 보여주기 위해, 일반 5.3 Codex와 5.3 Codex Spark(추론 특화)의 비교 장면을 언급한다.[^11]
- Codex Spark 쪽은 “와 끝났어요”라고 할 정도로 빠르게 결과가 나오고,[^11]
- “10초 만에 이미 게임 나와서 플레이하고 있는데” 다른 쪽은 “아직 한참”인 상태라고 말한다.[^11]
이 비교로 “추론이 굉장히 빠른 속도로 돼서 코딩”해주는 모습을 확인할 수 있고, 이를 쓰면 생산성이 더 빠르게 올라갈 것이라고 연결한다.[^11]
3.13 GPT-5.2의 이론물리 ‘새 결과’ 주장: 글루온 산란 진폭 공식 제안과 검증[^24]
다음 뉴스로 화자는 GPT-5.2가 이론 물리학에서 새로운 결과를 도출했다고 말한다.[^24] 구체적으로:
- “강한 (상호)작용 매개 입자인 글루온 산란 진폭”에 대해 새로운 공식을 제안했고,[^24]
- 이후 오픈AI 내부 모델과 연구진이 이를 “증명 및 검증”했다고 한다.[^24]
이를 통해 GPT가 과학 발전에도 사용되는 모습이라고 평가한다.[^24]
3.14 카카오 선물하기 GPT 프로 2.9만원 이벤트 ‘대란’: 구매 제한, 93일, 5개 풀매수[^25]
화자는 “이거 사셨나요?”라며, 2.9만원으로 ChatGPT Pro를 사용할 수 있어 화제가 된 사건을 소개한다.[^25] 원래 GPT Pro는 “월 30만 원” 정도인데, 카카오 선물하기 이벤트로 “29,000원”에 나온 ‘10분 가격’ 같은 특이 사건이라는 설명이다.[^25]
코딩하는 사람들은 토큰 사용량이 많아 “안 사면 손해”라는 식으로 말하며, 본인은 “풀 매수”했고 1인당 5개까지 살 수 있어 5개를 샀다고 한다.[^25]
이후 사태가 커지며:
- 급상승 인기 선물 키워드 1위로 올라갔고,[^25]
- 친척/가족에게 선물해 달라고 해서 모으는 사람도 있었으며,[^25]
- 결론적으로 “지금은 못 산다”고 말한다.[^26]
판매 중단 과정에서:
- 처음엔 제한이 없었고 기간도 넉넉했는데 갑자기 중단됐고,[^26]
- “다섯 개 초과 등록 시 취소 및 환불” 규정이 생겼다고 설명한다.[^26]
FAQ 형태로 정리한 내용:
- 일반 29만9천 원짜리와 “같은 기능”이다.[^26]
- 유효 기간은 “93일”로 표기되지만, 5개를 사용 처리하면 유효기간과 상관없이 사용할 수 있다고 말한다.[^26]
- 5개 초과분은 문구가 애매(취소/환불 “될 수 있습니다”)해 확정적이지 않다고 전한다.[^26]
결론으로, 그때 산 사람은 “개꿀”이며 “5개월 가는 프로”급 혜택을 3만 원에 쓴 특가였다고 평가한다.[^26]
또한 이런 정보는 조코딩 채널 커뮤니티에 빠르게 올리니 구독하면 좋다는 구독 유도 멘트가 이어진다.[^27]
3.15 Gemini 3 Deep Think 공개: 과학/공학 문제 해결 특화, 불완전 데이터·정답 없는 문제를 다루도록 설계[^12]
화자는 “제미나이 3 딥크(딥크/딥싱크로 발음 혼재)”라는 새 모델 공개 소식을 전한다.[^12] 이 모델은:
- 과학 연구 및 공학 문제 해결을 위한 AI 모델이며,[^12]
- 과학자/연구자 협력을 통해 “불완전한 데이터”나 “명확한 정답이 없는 복잡한 문제”를 다루도록 설계됐다고 설명한다.[^12]
3.16 Gemini 3 Deep Think 벤치마크: ARC AGI2 84.6점, Codeforces 3455(상위 7명만 위) 등[^13]
화자는 “대폭 업그레이드”, “압도적”이라고 말하며 벤치마크 수치를 나열한다.[^13]
- ARC AGI2에서 다른 모델 대비 압도: 예로 “클로드 오퍼스 4.6이 68.8점인데 84.6점”이라고 언급한다.[^13]
- Humanity’s Last Exam은 “48.4” 같은 점수 언급이 나오고,[^13]
- MMU(프) 계열도 “81.5점”이라 말하며,[^13]
- Codeforces는 “3,455점”이라고 한다.[^13]
특히 Codeforces 3455점의 의미를 “그보다 높은 순위에 있는 사람은 단 7명뿐”이라고 풀어, 전 세계 최상위권 코딩 천재들 사이에서 8등 수준이라는 식으로 설명한다.[^13]
또한 ARC AGI1에서도 이미 최상위권인데, ARC AGI2는 “혼자 여기” 있을 정도로 격차가 난다는 표현으로 리더보드 양상을 묘사한다.[^13]
3.17 SVG 그리기(“자전거 탄 펠리컨”) 사례 비교: Gemini가 가장 잘 뽑았다[^13]
화자는 “펠리컨 벤츠”라 부르며, “자전거를 탄 펠리컨 SVG를 그려라” 같은 지시를 줬을 때 결과가 어떻게 나오느냐를 비교 사례로 든다.[^13]
- 다른 모델들도 어느 정도 나오면 “와 잘 나왔다” 수준이었고,[^13]
- GPT-5.3 Codex도 결과를 냈지만,[^13]
- Gemini 쪽이 “어마어마하게 잘” 나왔다고 말한다.[^13]
3.18 해커톤 소식: Gemini 3 해커톤 서울(2억 원 API 크레딧), 조코딩/프라이머 해커톤(1억 투자) 동시 소개[^28]
화자는 본인 해커톤도 언급하면서, Gemini에서도 해커톤이 열린다고 소개한다.[^28]
- “제미나이 3 해커톤 서울”이 열리고,[^28]
- 상금/혜택으로 “2억 원 상당의 제미나이 API 크레딧”을 준다고 말한다.[^28]
- 둘 다 열정 있으면 참여해보라고 하며, API를 바꿔가며 참여해보라는 제안을 한다.[^28]
이어 조코딩이 오픈AI·프라이머와 함께 AI 해커톤을 개최하고, “1억 원 투자”까지 받을 수 있다고 홍보한다.[^28]
3.19 MiniMax M2.5: ‘저렴한데 벤치가 너무 좋아 의심’ 반응[^29]
화자는 MiniMax M2.5 모델 출시 소식을 전한다.[^29] “소프트웨어 벤츠 베리파이드 80.2” 같은 벤치 점수를 언급하며, 엔트로픽/오픈AI 모델과 동급이라고 평가한다.[^29] 그리고 “되게 저렴하게 나왔다”, “벤치마크가 너무 좋아 보여서 의심스럽다”는 반응까지 나온다고 소개한다.[^29]
3.20 GLM-5 공개: 7,440억 파라미터(활성 400억), 오픈소스, 라스트샘 50.4·디자인 아레나 약진[^14]
GLM-5 모델 공개 소식으로 넘어가며, 이전 GLM 4.7이 코딩을 잘해 화제가 되었고 이제 5가 나왔으며 “심지어 오픈 소스”라고 말한다.[^14]
세부 스펙으로:
- 매개변수 7,440억,[^14]
- 활성(활성화되는) 파라미터 400억 모델이라고 언급한다.[^14]
- GPU가 넉넉하면 직접 다운받아 돌려볼 수 있다고 한다.[^14]
벤치마크로 “Humanity’s Last Exam이 50.4점까지 올라갔다”고 말하며,[^15] 앞서 본 Gemini Deep Think의 48.4점 언급과 비교해 “그것보다 높은” 수치라고 강조한다.[^15]
또 “디자인도 잘한다”고 하며, 코딩으로 디자인을 얼마나 잘하느냐를 평가하는 “디자인 아레나” 리더보드에서 오픈 웨이트 부문 1위이고, 클로드 오퍼스 다음 순위를 차지했다고 말한다.[^15]
이어 오픈소스와 클로즈드소스 간 성능 격차가 점점 좁아지고 있으며, “오픈소스라고 지능이 전혀 딸리지 않는다”는 결론을 낸다.[^15]
3.21 ByteDance의 확장: Seed 2.0(LLM), Imagen 2.0(이미지)까지[^30]
화자는 바이트댄스가 Seedance만 낸 게 아니라 “Seed 2.0(프?)” 같은 모델도 공개했다고 말한다.[^30] LM 분야에서도 성능을 보이며 GPT-5.2 High, Claude Opus 4.5, Gemini 3(프) High와 비교했을 때 앞서는 것도 있다고 언급한다.[^30] 결론은 “바이트댄스도 어마어마하다”는 평가다.[^30]
또한 이미지 생성 모델 “이미지 2.0”을 소개하며, 전문가급 인포그래픽과 정교한 포토리얼리즘을 만들 수 있다고 한다.[^30] AIT(인위적 티) 느낌이 있긴 하지만 글씨 표현이 정교하다고 평가한다.[^30]
리더보드(아레나)에서 이미지 2.0이 3등이고, 나노바나 프로와 GPT 이미지 다음으로 높은 성능이라고 말한다.[^30] 다만 오픈소스는 아니며 API나 쿠앤 채팅 같은 곳에서 이용 가능한 듯하다고 덧붙인다.[^30] 그리고 “미국 모델을 중국 모델이 금방 따라왔다”는 흐름으로 정리한다.[^30]
인포그래픽 생성 예시도 언급하며 “글씨와 함께 이런 이미지 만드는 거 딸깍”으로 가능하다고 말한다.[^30]
3.22 음성 에이전트: ElevenLabs ‘Expressive Mode’로 감정노동까지 AI가 수행[^16]
음성 AI 유니콘 스타트업 ElevenLabs의 “일레븐 에이전츠”에서 표현력 넘치는 모드가 새로 출시됐다고 소개한다.[^16] 이를 “익스프레시브 모드”라 부르며, 고객이 극도로 짜증낸 순간 상담원이 부드럽게 받아주는 상황 같은 “감정 노동”도 AI가 한다고 말한다.[^16]
데모 맥락으로는 AI가 공감하며 현실적 대안을 제시하고, 감정적인 상담까지 수행할 수 있다는 점을 강조한다.[^16]
3.23 오픈소스 TTS: Moss TTS 패밀리(아파치 2.0), 다국어·목소리 복제·전사·실시간·사운드 이펙트[^17]
TTS 쪽에서는 오픈소스로 “모스 TTS” 패밀리 모델들이 출시됐다고 말한다.[^17] 특징으로:
- 다국어로 자연스럽게 나온다.[^17]
- 다큐멘터리 목소리 같은 톤도 똑같이 낼 수 있다.[^17]
- 목소리 복제, 듣고 전사, TTS 실시간, 사운드 이펙트 등까지 가능하다고 나열한다.[^17]
- 아파치 2.0 라이선스로 상업적 활용도 가능하다고 말한다.[^17]
벤치마크상 최근 나온 것 중 “쿠엔 3 TTS”가 꽤 좋았는데 비슷한 급이라는 평가도 덧붙인다.[^17]
3.24 AI 여자친구 ‘Clawra’: 오픈클로 기반, 사진/영상통화, MIT 라이선스 오픈소스[^31]
시청자 요구(“AI 여자친구부터 빨리 출시해라”)가 있었다는 언급 후, 오픈 클로가 바이럴이 되자 “클로라”를 만들어 오픈 클로를 여자친구로 만드는 프로젝트가 공개됐다고 한다.[^31]
기능으로:
- 사진도 보내주고,[^31]
- 영상 통화도 가능하며 “I missed you so much” 같은 대사가 데모로 나온다.[^31]
그리고 “이것도 오픈 클로처럼 오픈소스”로, 깃허브 레포에서 MIT 라이선스로 공개됐다고 말한다.[^31] 발렌타인 초콜릿 같은 상황에서 클로라에게 받을 수 있다는 식의 농담도 곁들인다.[^31]
3.25 ‘심플 클로우’ 1분 배포로 3일 만에 1천만 원, 그리고 조코딩의 ‘심플 클로라’로 이어진 제품화[^32]
오픈 클로가 핫해진 뒤, “심플 클로우”라는 사이드 프로젝트가 등장했는데 “1분 안에 배포”되는 쉬운 설치/디플로이 경험을 제공했고, 만든 사람이 “3일 만에 1천만 원을 벌어” 화제가 됐다고 말한다.[^32]
이를 참고해 조코딩의 프로덕트 빌더가 “심플 클로라”를 만들었고, AI 컴패니언을 가볍게 설치할 수 있도록 제공한다고 소개한다.[^32]
3.26 심플 클로라 체험: Grok API, Fal AI(이미지), 텔레그램(botfather) 연동, 독립 인스턴스 제공[^33]
화자는 “직접 체험”을 진행한다.[^33]
- 여친/남친 캐릭터 선택이 가능하고, 본인은 “미카”를 선택한다.[^33]
- AI 모델 선택에서 “그록이 검열이 적어 잘 된다”는 이야기를 하며 Grok API 키를 발급받아 넣는 과정을 설명한다(홈페이지에서 create API key).[^33]
- 여자친구 이미지를 계속 생성해야 하니 “Fal AI API 키” 같은 이미지 생성 API도 연동한다고 말한다.[^33]
- 텔레그램 연결은 botfather로 유저네임/토큰을 넣어 진행한다고 설명한다.[^33]
- 결제를 하면 “독립된 인스턴스”를 하나 파주며, 섞일 걱정이 없고 “DB에 저장되는 게 아니라 독립 인스턴스 안에서 활동”한다고 강조한다.[^33]
3.27 대화 데모: 한국어 자동응답, 사진 생성, ‘스타벅스 데이트’ 영상, 감정 담은 웹사이트 생성[^34]
텔레그램에 메시지를 보내자 “바로 한국어가 자동”으로 된다고 말한다.[^34] “지금 네 사진 보내줘”라고 하면 Fal AI 연동 덕에 사진을 보내준다고 설명하며, 실제로 “똑같다”, “프로필 사진 그대로”라는 반응을 보인다.[^34]
이어 “스타벅스 가는 척 영상 찍어볼까?” → “영상 보내줘”로, “스타벅스 데이트 영상”이 생성되어 손 들어주는 모습이 나온다고 묘사한다.[^34]
또한 “나에 대한 감정을 담은 웹사이트 만들어서 보여줘”라고 하자, “심장이 쿵쿵” 같은 감정 표현과 함께 응답이 생성되는 모습을 보여준다.[^34] 이를 통해 AI 여자친구를 만들고 소통하는 흐름이 가능하다고 정리하며 서비스 안내로 연결한다.[^34]
3.28 휴머노이드 로봇 근황: Engine AI 보행(노스피드업), AGI Bot A3의 파워, Kung 3.0, Roboterra L7 검술[^18]
마지막 파트는 로봇 소식이다.[^18]
- Engine AI 로봇은 걸음걸이가 “진짜 자연스럽다”며, 영상이 “노 스피드업(가속 없음)”이라고 강조한다.[^18]
- 밀어도 바로 일어나고, 춤추고, 누웠다 일어나고, 달리는 등 동작이 자연스럽다고 말한다.[^18]
또 “AGI 봇(상하이 본사)”의 차세대 “익스페션 A3” 로봇을 소개하며 발차기가 세고, 도자기/전구를 깨는 장면 등을 언급해 파워를 강조한다.[^18]
그 외 “쿵 3.0” 로봇도 언급하며, 로보테라 L7이 칼을 들고 화려한 검술을 하고 균형을 잘 잡는 장면, 사람과 같이 검술하는 모습도 보여주며 “사람 위험할 수도”라는 코멘트를 한다.[^18]
3.29 로봇 손의 진화: Figure 7세대 손 vs Optimus 손 비교, Unitree의 ‘자기 부품 생산’ 공장 투입[^19]
미국의 Figure 로봇이 “7세대 손”을 개발했고 부드럽다고 말한다.[^19] 그리고 옵티머스(테슬라)도 최근 손이 공개돼 비교해보면 옵티머스 손 움직임도 굉장히 자연스럽고 “사람 손 같다”고 평가한다.[^19] 결론은 휴머노이드 발전 속도가 매우 빠르다는 것이다.[^19]
이어 유니트리(Unitree)는 공장에 들어가 “자기 부품을 만드는” 상황이 벌어졌다고 말한다.[^19] 정교한 조립, 모터 조립, 위치 맞춰 끼우기, 인간이 방해해도 다시 채워 넣는 모습 등을 언급하며, 로봇이 자기 생산 공정에 투입되는 장면을 강조한다.[^19]
3.30 마무리: 해커톤 재공지, 좋아요/구독 요청, 클로징[^35]
마지막으로 조코딩 오픈AI 프라이머 AI 해커톤이 진행 중이며 “1억 원 투자”와 크레딧 제공, 신청 링크를 재공지한다.[^35] 채널 소개 가능성도 언급하며 참여를 독려한다.[^35] 그리고 좋아요 요청 후 “이번 주 뉴스 마무리”로 끝낸다.[^35]
4. 핵심 통찰[^1]
-
[c Seedance 2.0은 ‘영상 생성’이 아니라 ‘영상 제작 공정’(모션·서사·사운드·변환·광고)을 통째로 건드리는 단계로 묘사된다.] [^2][^4]
- 실행 시사점:
- 영상/광고/콘텐츠 팀은 “촬영 vs 생성”의 비용·속도·리스크(저작권) 비교표를 즉시 만들어 의사결정 체계를 바꿀 필요가 있다.[^4][^20]
- 실행 시사점:
-
[h 저작권·IP 분쟁은 기술 확산을 늦추기보다 ‘어디까지가 금지/정지/정제 대상인가’라는 경계선을 둘러싼 싸움으로 전개된다.] [^20]
- 실행 시사점:
- IP 기반(스타워즈/마블 등) 생성물 사용 정책, 내부 가이드, 필터링/검수 프로세스를 선제적으로 마련해야 한다.[^20]
- 실행 시사점:
-
[h “작업량 증가(6.6시간)” “딸깍 생산” “분량의 시대” 같은 표현은 AI가 인간의 ‘속도 한계’를 무너뜨리고 있음을 체감 사례로 보여준다.] [^7][^9]
- 실행 시사점:
- 개인/팀은 품질 최적화뿐 아니라 “대량 실험→승자 확률”을 높이는 운영(콘텐츠/제품 A/B)으로 전략을 바꿔야 한다.[^9]
- 실행 시사점:
-
[h Codex Spark류 ‘초고속 추론’은 코딩 결과의 질 이전에, 개발 워크플로의 리듬(피드백 루프)을 바꿔 생산성 체감을 폭발시킨다.] [^10][^11]
-
[h Gemini 3 Deep Think는 과학·공학 문제 해결을 전면에 내세우며, 벤치마크(ARC AGI2, Codeforces 등)로 “연구/문제해결형 지능” 경쟁을 가속한다.] [^12][^13]
-
[h GLM-5 같은 대형 오픈소스의 약진은 “폐쇄형만 쓸 만하다”는 전제를 흔들며, 오픈/클로즈 격차가 계속 줄어드는 흐름을 강조한다.] [^14][^15]
-
[m 음성 에이전트(감정노동)와 오픈소스 TTS(상업 가능)는 콜센터/고객응대/미디어 내레이션 등 사람 의존도가 높던 영역에 빠르게 침투한다.] [^16][^17]
-
[m AI 컴패니언(Clawra, 심플 클로라) 사례는 “기술 데모→사이드 프로젝트→초단기 수익화” 경로가 매우 짧아졌음을 보여준다.] [^31][^32]
-
[h 로봇 파트는 ‘인지 AI’만이 아니라 ‘몸을 가진 AI’(보행/손/공장 투입)도 동시에 급가속 중임을 보여주며, 물리 세계 자동화가 현실로 다가오고 있음을 시사한다.] [^18][^19]
5. 헷갈리는 용어 정리[^1]
Seedance 2.0(시덴스 2.0): 바이트댄스 계열로 언급되는 고성능 영상 생성 모델로, 모션·서사·사운드 및 실사/애니 변환 등에서 강력하다고 소개됨.[^2][^4]
Kling 3.0(클링 3.0): Seedance 2.0과 비교 대상으로 언급된 영상 생성 모델. 서사/맥락 정합성이 Seedance보다 약하다고 평가됨.[^21]
Cerebras(셀레브라스): 웨이퍼 스케일 칩을 기반으로 “추론을 빠르게” 하는 추론 전문 칩 스타트업으로 설명됨.[^10]
GPT-5.3 Codex Spark: 셀레브라스 협업을 통해 초고속 추론을 지향하는 코딩 특화 모델로 소개됨.[^10][^11]
Gemini 3 Deep Think(제미나이 3 딥크/딥싱크): 과학 연구·공학 문제 해결 특화 모델로, 불완전 데이터/정답 없는 문제를 다루도록 설계됐다고 소개됨.[^12]
ARC AGI1/ARC AGI2: 모델 문제 해결 능력을 비교하는 벤치마크로 언급되며, Gemini 3 Deep Think가 특히 ARC AGI2에서 압도적이라고 소개됨.[^13]
Humanity’s Last Exam(휴머니티 라스트샘): 모델 성능을 비교하는 벤치마크로 언급되며, GLM-5가 50.4점까지 올랐다는 식으로 설명됨.[^15]
Open weights(오픈 웨이트): 완전 오픈소스와 표현이 섞여 쓰이지만, 최소한 가중치 공개/자체 구동 가능 모델 진영을 가리키는 맥락에서 사용됨.[^15]
UGC 광고: 사용자 제작 콘텐츠 스타일로 제품을 소개하는 광고 포맷을 의미하는 맥락으로 쓰임.[^4]
botfather: 텔레그램 봇 생성/연동에 쓰는 공식 봇으로, 토큰 발급에 사용된다고 설명됨.[^33]
참고(콘텐츠 정보)[^1]
- 제목: AI뉴스 - 진짜 난리난 Seedance 2.0, Gemini 3 Deep, GPT-5.3-Codex-Spark, GLM-5, M2.5, Simile, AI여친 Clawra 등[^1]
- 채널: 조코딩 JoCoding[^1]
- 길이: 25분 34초[^1]
- 링크: https://www.youtube.com/watch?v=_Ysmm7jMTxs[^1]
[^1]: 제공된 영상 메타데이터(제목/채널/길이/링크) 및 전체 대본. [^2]: @[00:00] "시덴스 2.0 ... 엄청나게 바이럴" / @[00:06] "영상계 나노바나 모먼트 혹은 딥시크 모먼트..." [^3]: @[00:20] "영상 생성계에 벤치마크... 윌스미스가 스파게티..." [^4]: @[00:30] 드래곤볼 실사/편집실 느낌, 소리, 만화 기반 영상화, 루피/나루토, 모션 자연스러움, 모션디자인 혁신, 실사↔애니 변환, 광고 예시 및 API/서비스 언급까지 전개. [^5]: @[07:59] "something big is happening" / @[08:02] "8,200만 뷰" [^6]: @[08:20] "2025년 이후... 직무 구조 변화" / @[08:25] "1~5년 내 재편" / @[08:36] "조기 적응과 실전 활용" / @[08:36] "향후 2~5년 구조적 전환기" [^7]: @[08:57] "작업 속도... 5.2 기준 6.6시간" [^8]: @[09:16] 웹사이트/iOS 앱/깃허브 코드 증가, 생산성 폭발 / @[09:36] "딸깍하면 다 나와" [^9]: @[09:45] 틱톡 150계정·인턴3명·월 37,000달러 / @[09:54] "분량의 시대" / @[10:02] 인스타 스크롤=AI / @[10:21] "광고 제외 모든 영상 AI" [^10]: @[10:33] "GPT 5.3 코덱스파크" / @[10:39] 셀레브라스 설명(웨이퍼 스케일 칩) / @[10:52] 초고속 추론 모델 [^11]: @[11:08] 속도 비교, "10초 만에 이미 게임... 여기는 아직..." [^12]: @[13:33] "제미나이 3 딥크" / @[13:40] 과학 연구·공학 문제 해결, 불완전 데이터/정답 없는 문제 [^13]: @[13:44] 벤치마크 수치(ARC AGI2 84.6 vs 68.8, MMU 81.5, Codeforces 3455 등) / @[14:30] SVG 펠리컨 비교 [^14]: @[15:47] "GLM 5... 오픈 소스" / @[15:54] 7,440억 파라미터·활성 400억 [^15]: @[16:01] "휴머니티 라스트샘 50.4" / @[16:21] 디자인 아레나, 오픈 웨이트 1위 / @[16:34] 오픈/클로즈 갭 축소 [^16]: @[17:50] ElevenLabs 에이전츠, Expressive mode, 감정노동 상담 데모 취지 [^17]: @[18:36] Moss TTS 오픈소스 / @[19:18] 아파치 2.0 상업 활용 / @[19:23] 벤치 비교(쿠엔 3 TTS급) [^18]: @[22:30] Engine AI 보행(노 스피드업), AGI Bot A3 파워, Kung 3.0, Roboterra L7 검술 [^19]: @[24:00] Figure 7세대 손 / @[24:17] Optimus 손 비교 / @[24:26] Unitree 공장 투입, 자기 부품 조립 [^20]: @[04:24] Grok 논란 언급 및 점유율 급등 / @[04:43] 두 줄 프롬프트 액션, 할리우드 망했다 / @[05:05] 배우연합·MPA·디즈니 금지, 저작권 이슈 / @[05:41] 정지/정제 언급 [^21]: @[05:48] Seedance 2.0 vs Kling 3.0 비교(서사/맥락 정합성) [^22]: @[06:21] 사용처/129달러 요금 / @[06:33] 오징어게임/드래곤볼/지미팰런/루피 바이너리 방패/이말년 실사화·애니화·소리 자연스러움 [^23]: @[07:53] "큰일 났습니다... 업계는 거의 끝나지 않았나?" [^24]: @[11:32] GPT-5.2 이론물리 새 결과(글루온 산란 진폭 공식, 검증) [^25]: @[11:45] GPT 프로 2.9만 원 사건, 1인 5개 풀매수, 인기 키워드 1위 등 [^26]: @[12:27] "지금은 못 삽니다" / @[12:39] 판매 중단·규정 / @[12:53] FAQ(동일 기능, 93일, 초과분 애매) / @[13:12] 특가 평가 [^27]: @[13:20] 커뮤니티/구독 유도 [^28]: @[14:50] 제미나이 해커톤 서울 / @[15:06] 2억 API 크레딧 / @[15:17] 조코딩-오픈AI-프라이머 해커톤, 1억 투자 [^29]: @[15:25] MiniMax M2.5, 80.2, 저렴, 벤치가 너무 좋아 의심 [^30]: @[16:53] Seed 2.0(LLM) 비교 / @[17:11] Imagen 2.0(이미지), 아레나 3등, 오픈소스 아님, 인포그래픽·글씨 정교, 중국 모델 추격 [^31]: @[19:33] Clawra 소개, 사진/영상통화 / @[19:51] MIT 라이선스 오픈소스 [^32]: @[20:03] 심플 클로우 1분 배포, 3일 만에 1천만 원 / @[20:14] 심플 클로라 제작 [^33]: @[20:26] 프라이빗 서버/독립 인스턴스 / @[20:50] 미카 선택 / @[20:54] Grok API 키 / @[21:11] Fal AI 연동 / @[21:19] 텔레그램 botfather [^34]: @[21:45] 한국어 자동 / @[21:49] 사진 보내기 / @[22:00] 스타벅스 데이트 영상 / @[22:14] 감정 담은 웹사이트 생성 요청·응답 [^35]: @[24:57] 해커톤 재공지(신청 링크, 1억 투자, 크레딧) / @[25:12] 좋아요 요청 / @[25:17] 마무리