https://www.youtube.com/watch?v=3MnrLvUR-DI
1. 이건 꼭 알아야 한다
- [? 질문] 최근 AI 생태계에서 “모델 성능”뿐 아니라 “제품 통합/가격/정책/윤리·안보”가 동시에 급격히 변하면서, 개인·기업이 어떤 도구를 어디까지 신뢰하고 어떻게 활용해야 하는가? @[00:00]
- [= 답] (1) 이미지·코딩·에이전트 도구는 더 빠르고(Flash, Diffusion), 더 싸지고(단가 하락), 더 깊게 제품에 통합되는 방향으로 진화 중이며, (2) 동시에 계정 정지·정책 리스크(외부 연동 밴), 군사적 사용 논쟁(국방부 vs 앤트로픽), 모델 증류/탈취(중국발 증류 탐지) 같은 비기술 리스크가 커지고, (3) 오픈소스/소비자 GPU 구동 모델(Qwen 3.5 Medium 등)과 에이전트형 제품(Perplexity Computer, Cursor cloud computer)이 확산되며 “개인 1인 생산성/창업”으로 무게중심이 이동한다는 것이 영상의 전체 결론적 메시지다. @[00:16][04:42][10:40][15:12][16:05][17:14][22:04]
2. 큰 그림
이 영상은 조코딩 채널의 “AI 뉴스” 형식으로, 구글(Gemini/Flow/Stitch)·QuiverAI·Anthropic(Claude)·Perplexity·Cursor·Sakana AI·오픈소스(Qwen) 등 여러 플레이어의 업데이트/사건을 짧은 시간축으로 촘촘히 연결해 보여준다. @[00:00][02:12][06:12][07:00][17:14][20:27]
목적은 “새로 나온 기능 소개”에 그치지 않고, 도구 선택 시 비용/속도/품질뿐 아니라 정책·윤리·안보·시장 구조 변화까지 고려해야 한다는 분위기를 전달하는 데 있다. @[04:17][10:59][14:21][21:21]
핵심 메시지 3개
- 생성형 모델은 “품질 상향 평준화”와 “속도·가격 혁신”이 동시에 진행 중(나노바나나2/머큐리2/라바SR). @[00:07][01:12][19:11][19:54]
- 에이전트/컴퓨터 사용형 제품이 본격적으로 “실무 자동화” 단계로 들어가며(Perplexity Computer, Cursor의 컴퓨터 접근), 작업의 형태 자체가 바뀐다. @[17:14][18:41]
- 기업·국가·정책 충돌(국방부-앤트로픽, 외부연동 밴, 중국 증류)이 커지며 “기술 외 리스크”가 사용자의 핵심 변수가 된다. @[04:23][10:40][15:12]
3. 하나씩 살펴보기
3.1 나노바나나 2(= Gemini 3.1 Flash 기반 이미지 모델) 출시: 빠르고 싸고, 품질도 충분히 좋다 @[00:00]
영상은 “나노바나나 2가 출시”되었다는 소식으로 시작한다. 이 모델은 Gemini 3.1 Flash 모델 기반의 이미지 생성 모델로 소개된다. @[00:02]
조코딩은 기존 “프로(Pro)” 계열 이미지 생성의 단점이 생성 속도가 느리고 가격이 비싸 제품/API로 쓰기 부담스러웠다는 점을 먼저 깔고, Flash 기반으로 나온 나노바나나 2는 가볍고 빠르고 저렴하면서도 “퀄리티도 괜찮다”고 평가한다. @[00:09][00:12][00:16]
기능/품질 측면에서 나노바나나 2는 다음을 지원한다고 언급한다.
- 세계 지식 기반 렌더링
- 정확한 텍스트 표현
- 번역
- 주제(콘셉트) 일관성
- 최대 4K 해상도 출력 지원 @[00:22]
또한 “구글 앱 전반에 바로 적용”되어 접근성이 커졌고, Gemini(재미나이)에서 바로 사용, 검색 AI 스튜디오, Gemini API, 그리고 Flow/Google Ads 등 다양한 제품군에서 활용 가능하다고 말한다. @[00:25][00:33][00:36]
특히 눈여겨본 특징으로 “웹 검색에서 얻은 실시간 정보를 반영한다”는 점을 든다. 예시로 “오늘의 날씨” 같은 프롬프트를 주면 검색해서 가져와 반영할 수 있고, 인포그래픽도 정확하게 잘 된다고 설명한다. @[00:36][00:44][00:52]
조코딩의 체감 평은 “이미지는 거의 끝나지 않았나? 웬만한 만들 수 있는 것들은 다 만들 수 있다”는 말로, 이미지 생성 품질이 일정 수준 이상 성숙해졌다는 인상을 전달한다. 그 결과 “이 정도 퀄리티 이미지를 더 저렴하고 빠르게 만들 수 있다”가 나노바나나 2의 핵심 가치라고 정리한다. @[01:00][01:05][01:07]
가격(단가) 구체 수치 제시
영상은 내부 코드 모델명이 “Gemini 3.1 Flash Image Preview”라고 언급하며, 가격을 구체 수치로 설명한다.
- 이미지 입력(?) 비용으로 0.25달러 언급 @[01:12][01:14]
- 출력 비용:
- 0.5K 이미지당 0.045달러 → “60몇 원 정도”로 환산 @[01:14][01:17]
- 1K 이미지는 “100원 좀 안 되게” @[01:19]
- 4K는 “조금 비싸긴” 하지만 0.15 정도 → “200원 정도”로 언급 @[01:20][01:22][01:24]
그리고 “프로와 비교”를 통해 이전 대비 1/3 가격 수준으로 저렴해졌다고 말한다. @[01:31][01:34]
직접 테스트: 한글 간판 명동 거리
조코딩은 Gemini에서 직접 테스트한다. 프롬프트는 “한글 간판이 가득한 명동 길거리의 사진”으로, 결과에서 간판 텍스트가 비교적 잘 유지되는 것(“글씨가 많이 안 깨졌다”)을 강조한다. @[01:41][01:48]
같은 프롬프트로 프로 모델과 비교하며, 프로가 일부 요소(예: “올리브영” 표기)가 더 낫게 표현된 듯 보이나, “퀄리티 차이는 큰 차이는 없다”고 평가한다. 다만 프로가 약간 더 낫긴 한 것 같다는 뉘앙스는 남긴다. @[01:53][01:58]
결론은 “빠른 속도, 가성비 있게 저렴하게 뽑는다”면 나노바나나 2가 적합하다는 것. @[02:02]
3.2 구글 Flow 업데이트: 이미지·영상 생성 통합 ‘AI 크리에이티브 스튜디오’로 확장 @[02:12]
다음 소식은 구글이 다양한 제품에 AI를 적용하는 흐름의 연장으로, Flow가 업데이트되며 “완전한 AI 기반 크리에이티브 스튜디오로 확장”된다는 내용이다. @[02:16][02:20]
기존에 Flow 외에도 Whisk, Image FX 같은 툴이 따로 있었는데, 이를 “통합적으로 아우르는” 형태로 바뀌었다고 설명한다. @[02:24][02:28]
Flow 안에서
- 이미지 생성
- 영상 생성 을 모두 처리할 수 있게 되었고, 이미지에서 일부를 동그라미로 지정해 변형하거나, 그 이미지를 영상으로 확장하는 흐름을 예시로 든다. @[02:34][02:38][02:41][02:44]
UI/워크플로 측면에서는
- 프롬프트 창에서 드래그 앤 드롭
- @ 태그로 에셋/요소 지정
- 에셋 탐색을 위한 그리드, 이미지·비디오 검색 후 드래그해 프로젝트에 넣기
등을 언급하며, 전반적으로 “SaaS 툴처럼 바뀌는 것 같다”고 평가한다. @[02:44][02:48][02:52][02:56][03:00]
그리고 시장 맥락으로, 원래 이런 종합 이미지/영상 툴 서비스들이 많았는데(예: 익스필드 등 언급), 구글이 그 영역을 “가져가는” 형태로 보인다고 말한다. @[03:04][03:09]
3.3 구글 Stitch 개선: ‘Direct Edit’로 디자인 결과를 세부 단위로 수정 가능 @[03:09]
조코딩은 Stitch를 “AI로 디자인을 생성해주는 도구”로 소개하면서, 최근 Direct Edit 기능이 추가되었다고 말한다. @[03:12][03:16]
예시로 “테니스 앱”을 입력하면 디자인 시안이 나오는데, 이전에는 세부 수정이 어려웠으나 이제는 디테일한 수정이 가능해졌다. @[03:19][03:22][03:24]
Direct Edit로
- 개별 텍스트/이미지 등을 지정해 수정
- Edit AI를 통해 원하는 부분만 골라 AI로 수정
- 기존 디자인을 보고 “어떤 걸 바꾸라”고 지시해 변경
같은 작업이 가능하다고 설명한다. @[03:26][03:29][03:32][03:37]
3.4 구글 AI 계정 제재 논란: 외부 서비스 ‘구독 연동(OAuth)’이 사전 경고 없이 밴으로 이어질 수 있다 @[03:41]
여기서 분위기가 기능 소개에서 “정책 리스크”로 전환된다. 조코딩은 구글 AI 관련 논란으로 사전 경고 없는 계정 제한/정지가 발생하고 있다고 말하며, 특히 Google AI Ultra(월 249달러) 같은 유료 요금제 이용자도 “그냥 연구밴(계정 정지)”을 당했다는 사례를 든다. @[03:45][03:49][03:57]
핵심 맥락은 “OpenWebUI(영상 내 발음 ‘오픈 클로우스/오픈 클로’로 표현)” 같은 외부 도구와의 연동 방식이다.
- 외부 도구를 쓰는 방법에는 API 키 입력 방식이 있고,
- OAuth 연동으로 “내 구독 요금제와 연동해 구독으로 제공되는 토큰을 소진”하는 방식이 있는데,
이 OAuth 연동이 정책 위반으로 간주될 수 있다는 것이다. @[04:01][04:08][04:17][04:20]
조코딩은 “구독을 이용해 토큰을 저렴하게 쓰게 해준 건 구글 생태계 내 서비스 이용을 전제로 한 것인데, 그걸로 외부 서비스를 이용하는 것은 막으려는 것 같다”고 추정한다. 이유는 외부 사용은 원래 API 과금으로 수익을 내야 하는데 구독 토큰을 외부에서 쓰면 구글 수익 구조와 충돌하기 때문이라는 해석이다. @[05:12][05:26][05:29]
사례의 충격 포인트는
- “무관용 원칙”으로 계정 복구 자체를 거부
- 아무 사전 경고 없이 “그냥 밴”
- “확장 프로그램만 사용했는데 밴” 같은 사용자 경험
을 언급한다. @[04:23][04:26][04:42][04:46]
따라서 조코딩은 “외부 서비스 연동은 조심”해야 하며, 섣불리 “구독이랑 연동되네” 하고 연결했다가 정지될 수 있다고 경고한다. @[04:34][04:38][04:40][04:49]
또한 비교 맥락으로 “Codex는 상(용?)업자/담당자를 모셔왔다”는 언급과 함께, Codex는 상대적으로 안전하지 않을까 추정하면서도, 자신은 Codex를 OAuth로 구독 토큰 연동해 쓰고 있다고 말한다. 결론적으로는 외부 연동보다 (안전한) 방식 선택을 고민해야 한다는 톤이다. @[04:53][04:58][05:00][05:02]
이 논란이 “오픈AI에게는 기회”가 될 수 있다고도 말한다. 구글이 제한을 강화하면, 외부 연동이 상대적으로 자유로운 쪽으로 사용자가 이동할 수 있다는 관점이다. @[05:04][05:06]
3.5 QuiverAI Arrow(L1): SVG 생성에서 Gemini 3.1을 ‘압도’하고 디자인 아레나 1등 @[05:38]
다음은 SVG 생성 품질 경쟁. 원래 Gemini 3.1이 “SVG를 굉장히 잘 생성”한다고 화제가 됐는데, 이를 뛰어넘는 모델로 **Quiver AI가 만든 모델(Arrow, L1)**이 등장했다고 소개한다. @[05:38][05:42][06:18][06:20]
SVG 예시로 듀오링고 마스코트 같은 이미지를 벡터(SVG)로 만드는 장면을 설명한다. SVG는 선/점 기반이라 확대해도 깨지지 않고, 편집(점 이동/조절) 가능한 벡터라는 정의도 덧붙인다. @[05:42][05:52][05:56]
비교 결과로 “Gemini 3.1에서 같은 프롬프트를 사용했을 때 결과가 훨씬 나빴다”, 즉 Quiver 쪽이 더 좋은 결과를 냈다고 한다. Gemini 결과도 “괜찮게 나오지 않았나” 싶었지만 “이 정도로 퀄리티가 다르다”고 격차를 강조한다. @[06:01][06:04][06:08][06:12]
디자인 아레나 점수: 압도적 격차
“디자인 아레나”라는 모델 비교/랭킹에서 Quiver AI가 1등을 했고, 점수 차이가 “압도적”이라고 말한다.
- Gemini 쪽 점수: 1429점
- Quiver L1: 1583점 @[06:12][06:18][06:21][06:23][06:24]
직접 사용: 실시간 드로잉, 무료, 벡터라이즈
조코딩은 “man who’s coding(맨 후스 코딩)” 정도로 테스트하며, 그리는 모습이 실시간으로 나오는 점을 신기해한다. 그리고 “무료”라고 강조한다. @[06:27][06:31][06:34][06:37]
추가로 “벡터라이즈” 기능을 궁금해하며, 기존 로고처럼 원래 벡터로 만든 이미지가 아니라 비트맵 이미지를 넣었을 때도 벡터화가 가능한지를 시험한다. 이미지를 넣고 벡터라이즈하자 “로고랑 같이 보면 벡터로 그리고 있다”고 반응하고, 잘못 그린 것 같으면 다시 그리기도 한다고 언급한다. 결과가 “거의 비슷”하며 전반적 퀄리티가 괜찮다고 평가한다. @[06:39][06:43][06:48][06:51][06:53][06:57]
마지막으로 “이게 SVG니까 웹사이트 안에 넣으면 그대로 들어간다”고, 웹 배포/활용 측면의 실용성을 강조한다. @[06:57][07:00]
3.6 Claude Code 업데이트: Remote Control로 폰에서 집 컴퓨터의 코딩 작업을 이어간다 @[07:00]
다음 소식은 클로드 코드(Claude Code). “더 좋아졌다”며 원격 제어(Remote Control) 기능이 추가되었다고 소개한다. @[07:00][07:03]
OpenWebUI처럼 메신저형으로 지시해 알아서 작업시키는 장점이 있었는데, Claude Code에서도 Remote Control 모드를 켜면 가능해진다는 흐름이다. @[07:07][07:11]
사용 방법은 /remote-control(슬래시 리모트 컨트롤) 명령을 입력하면 자동으로 앱과 연동된다고 설명한다. 작업하다 급히 나가야 할 때 이 명령어만 치면 원격 연결이 된다는 식이다. @[07:14][07:23][07:25]
연동 대상은 “클로드 앱(스마트 앱)”에서 바로 연결해 작업을 시킬 수 있고, 집 컴퓨터와 연동되어 이동 중(지하철 등)에도 코딩할 수 있는 환경이 됐다고 말한다. @[07:28][07:32][07:35][07:37]
3.7 VS Code 확장: AI 에이전트를 ‘가상 오피스’ 픽셀 아트로 시각화하여 상태를 직관적으로 본다 @[07:40]
조코딩은 VS Code 확장 트렌드로 “AI 에이전트가 터미널에만 떠서 직관적으로 보기 어렵다”는 문제를 제시한다. 이를 해결하기 위해 가상 사무실에서 일하는 픽셀 아트 캐릭터로 에이전트 상태를 보여주는 확장/프로젝트가 소개된다. @[07:40][07:43][07:48]
Claude Code에 “서브에이전트 두 명을 불러” 작업시키면, 픽셀 오피스에 두 캐릭터가 조인하고, 각각의 상태/무엇을 하는지 마우스를 올려 확인할 수 있다고 설명한다. 삭제하면 삭제 동작까지 바로 반영되는 등, 변경이 실시간으로 시각화된다고 말한다. 결론적으로 “가상 오피스에서 어떻게 작업하는지 보면서 클릭해 확인” 가능한 형태를 만들 수 있다는 것이다. @[07:55][08:03][08:08][08:14]
3.8 Claude Code 자동 메모리: 세션 간 학습/패턴/선호 접근을 저장해 재사용 @[08:14]
클로드 코드에 자동 메모리 기능이 출시됐다고 전한다. 이는 세션 전반에서 학습된 내용(컨텍스트, 디버깅 패턴, 선호 접근 등)을 기억해둘 수 있게 하는 기능이다. @[08:14][08:19][08:24]
이전에는 세션을 새로 시작하면 학습 내용이 저장되지 않았는데, 이제는 별도로 저장해서 “메모리 형태”로 자주 쓰는 디버깅 패턴까지 저장 가능하다고 한다. 그리고 “지난 세션에서 했던 것을 이용하겠다”처럼 연동해 쓰는 모습을 언급한다. @[08:31][08:36][08:40][08:45]
3.9 Agent.md(컨텍스트 파일) 과용의 역효과: 비용 20% 증가 + 성능 저하 가능 @[08:50]
AI 코딩 에이전트용 컨텍스트 파일(Agent.md 등)을 구성하는 관행에 대해, 오히려 “비용만 20% 늘어난다”는 얘기가 있다고 소개한다. @[08:50][08:54][09:01]
직관적으로는 더 체계적이라 좋아 보이지만, 에이전트가 스스로 발견 가능한 정보를 중복 제공하면 문제가 된다는 논리다. 결과적으로
- 비용 증가(20%),
- 성능 저하(중복 정보로 인한 비효율) 가 발생할 수 있다고 말한다. @[09:05][09:09][09:15][09:17]
따라서 넣어야 할 것은 “발견 불가능한 정보”라고 정리한다. 예를 들어
- 도구 지정
- 비직관적 규칙
등은 넣되, 디렉토리 구조 같은 기본 정보는 에이전트가 파악 가능하므로 굳이 넣을 필요가 없다고 조언한다. @[09:18][09:20][09:24][09:28]
3.10 “개도 코딩” 사례: Claude Code + 보상 시스템으로 강아지가 게임을 만들었다 @[09:28]
코딩이 너무 쉬워져 “개나 소나 다 코딩하겠네”라는 말이 나오는데, 실제로 “개가 코딩을 시작했다”는 재미 사례를 소개한다. 제목은 “내 강아지에게 바이브 코딩을 가르쳤다. 강아지가 실제로 게임을 만들었다”는 내용. @[09:31][09:41][09:47]
구현 방식:
- Claude Code 사용 @[09:49][09:52]
- Godot 엔진으로 게임 제작 @[09:52][09:54]
- 입력은 라즈베리파이 + Dog Keyboard 앱으로 전달 @[09:57][09:59]
- 일정 글자 수 입력 시 스마트 급식기가 간식 보상 제공 → 더 입력하게 유도 @[10:01][10:04]
핵심 프롬프트 설계가 독특한데, Claude Code에 “암호 같은 언어로 지시하는 턴제 게임 디자이너”라는 설정을 걸어둔다. 강아지는 의미 없는 입력을 하지만, Claude는 “천재 게임 디자이너가 암호로 썼을 것”이라 가정하고 이를 게임 아이디어로 해석해 발전시킨다는 것이다. @[10:06][10:11][10:16][10:22][10:26]
또 자동 피드백 루프를 구성해 스스로 게임 테스트/수정까지 하도록 만들었다고 하며, “애매하게 말해도 찰떡같이 알아듣는 Claude Code”의 재미 포인트로 소개한다. @[10:26][10:31]
3.11 앤트로픽 vs 미국방부 갈등: “대규모 국내 감시/완전 자율무기” 사용 금지 선언 → 국방부는 공급 위험 기업 지정 지시 @[10:37]
이후 영상은 가장 큰 사회적 이슈 중 하나로 넘어간다. 조코딩은 “클로드 관련해 미국방부와 엄청 갈등”이 있다고 하며, 앤트로픽 CEO 다리오 아모데이가 성명문을 냈다고 전한다. @[10:37][10:40][10:43]
배경: 국방 분야에서 Claude 사용
미국방부는 Claude를 사용하고 있으며, “나두로 체포(작전) 때도 Claude를 썼다”는 언급, 그리고 “전쟁 무기에도 사용”된다고 말한다. @[10:46][10:50][10:54]
앤트로픽의 원칙: 감시·자율무기에는 쓰지 말라
앤트로픽은 윤리 문제 때문에 오픈AI 출신들이 나와 창업한 회사라는 맥락을 붙이고, Claude 이용 조건으로
- 시민 감시(대규모 국내 감시)
- 완전 자율 무기
에 사용하지 말라는 조건이 있다고 설명한다. @[10:54][10:59][11:04]
그런데 국방부가 무기 개발에 사용하고 있으니 “진짜 위험하다”며 하지 말라는 성명을 낸 것이고, 특히 “이란” 등 최근 국제 정세가 불안한 상황에서 Claude가 기여했다는 식의 주장/우려가 포함된 뉘앙스를 전달한다. (영상에서는 “요즘 난리”, “기여했다”는 표현으로 연결) @[11:08][11:13][11:17]
아모데이는 “대규모 국내 감시와 완전 자율무기 두 분야는 안 된다, 제공할 수 없다”고 강력 주장했다고 정리한다. @[11:17][11:20]
국방부의 반격: ‘국가 안보 공급 위험 기업’ 지정 지시 + 미군 거래 업체 전면 사용 금지
이에 대해 조코딩은 미국방부 장관이 직접 앤트로픽을 국가 안보 공급 위험 기업으로 지정하도록 지시했다고 전한다. 결과적으로 “미국 기업이 미국방부의 적이 된” 구도가 됐다는 표현을 쓴다. @[11:28][11:31][11:33]
조치가 매우 강력한데,
- 미군과 거래하는 모든 업체에서 앤트로픽 사용 금지
라고 설명한다. @[11:36][11:41]
국방부는 “모든 합법적 국방 목적에 대해 무제한 모델 접근”을 요구했으나, 앤트로픽이 거부하자(“너네한테 공급 못 한다”), 국방부가 격분해 위험 기업 지정/사용 금지로 갔다는 흐름으로 이야기한다. @[11:42][11:46][11:48][11:50][11:53]
조코딩은 이 사안을 “Claude가 미군 기밀 시스템에 사용되는 유일한 AI 모델”이라는 점, 그리고 이런 조치가 “최초의 사례”이며 “AI 기업과 국가 안보 간 중대한 선례”를 남겼다고 설명한다. 앞으로 어떻게 처리될지 궁금하다고 덧붙인다. @[11:58][12:03][12:08][12:12]
윤리 vs 현실안보: 터미네이터 위험과 중국 변수
조코딩은 자율무기에 쓰이면 “터미네이터 세상” 같은 위험이 올 수 있다는 점에서 앤트로픽의 제동이 화제가 되는 이유를 설명한다. @[12:13][12:17]
하지만 동시에 중국은 “무조건 적용”할 것이고, 미국이 AI 기업들의 반대로 국방부 사용이 막히면 중국이 국방에서 앞설 수 있어 “위험하지 않나”라는 우려도 제기한다. @[12:46][12:53][12:59][13:01][13:03]
연대 서한: 구글·오픈AI 현직원 709명 공개서한
이 갈등을 계기로 구글과 오픈AI 현직원 709명이 공개 서한을 내어 “두 회사가 연대하여 국방부 요구를 거부하라”고 촉구했다고 전한다. “우리는 분열되지 않을 것이다”라는 구호도 언급한다. @[12:24][12:28][12:32][12:37]
여기서 조코딩은 “AI 군사적 오용이 이제 실질 적용 단계에 들어갔다”고 해석한다. 기업은 “아직 위험한데 쓰면 안 될 것 같다”는 입장, 국방부는 “국방력 위해 필요”하다는 입장이 충돌하는 것으로 정리한다. @[12:41][12:46]
결과적 바이럴: 앤트로픽 앱스토어 1위
이 사건이 지지를 받으며 앤트로픽이 미국 앱스토어 1위까지 갔다고 한다. “국방부와 싸우니 응원해야지”로 설치하는 사람, “국방부가 쓸 정도면 성능이?” 해서 궁금해서 써보는 사람까지 합쳐져 바이럴이 됐다는 설명이다. @[13:08][13:10][13:12][13:20][13:23]
3.12 오픈AI의 기회 포착: 국방부 비공개 네트워크 모델 배포 합의(조건은 ‘애매’) @[13:27]
조코딩은 “이게 기회”라며 오픈AI가 국방부와 비공개 네트워크 내 모델 배포에 합의했다고 전한다. Claude가 거부한 빈자리를 오픈AI가 들어간 구도(“클로드 안 된다고 아싸”)로 묘사한다. @[13:27][13:30][13:33][13:37]
합의에는 “대규모 국내 감시 금지”가 포함돼 있다고 말하면서도, 이 조건이 “애매하다”는 평가를 붙인다. 이유는 대중의 반대가 있으니 “자율무기 팍팍 쓰세요”라고 노골적으로 하긴 어렵다는 맥락이다. @[13:37][13:40][13:43][13:48]
또한 표면적으로는 앤트로픽의 제한(감시/자율무기 금지)과 오픈AI 합의 조건이 비슷해 보일 수 있지만,
- 국방부에 “일시적 제한” 정도만 약속했을 수 있다는 추측, @[14:09]
- 팔란티어 등을 통해 감시를 우회할 수 있다는 얘기, @[14:12]
- 샘 알트만에 대한 신뢰 부족 언급, @[14:15][14:18] 을 덧붙이며 “실제 운용은 다를 수 있다”는 의심의 여지를 남긴다.
오픈AI가 돈이 급한 상황이라 기회로 작용했을 수 있다는 해석도 제시한다. @[14:18][14:21]
마지막으로 조코딩 개인 의견이 나온다. 중국이 있는 한 “어차피 무기가 될 것 같고”, 결정은 어렵지만 “중국이 도입하는데 안 도입할 수는 없지 않을까”, 미국이 패권을 잃고 전쟁에서 지면 “아예 소용이 없다”는 논리로, 결국 도입을 할 수밖에 없을 것 같다고 말한다. @[14:21][14:24][14:27][14:30][14:35][14:38]
3.13 앤트로픽의 ‘중국 모델 증류’ 탐지 공식 발표: DeepSeek 의혹이 “진짜였다”로 연결 @[14:38]
중국 이야기에서 이어서, 조코딩은 과거 공동업자(벤만)와의 인터뷰에서 “오픈소스 모델이 너무 좋아지는 것 아니냐”를 물었고, 2025년 11월 즈음부터 어떤 추측이 있었다는 뉘앙스를 언급한다. 그리고 “이게 진짜였다”고 전환한다. @[14:38][14:41][14:44][14:55][15:01]
앤트로픽이 공격 탐지/대응을 했다고 공식 공개했는데, “중국 AI 기업들이 미국의 최신 AI를 증류(distill)해서 답변을 뽑아 자기네 모델을 훈련”시켰고, 이를 직접 탐지했다고 한다. 딥시크(DeepSeek) 때도 의혹이 있었는데 “진짜”라는 것이다. @[15:07][15:12][15:19][15:26]
구체적으로 앤트로픽은
- DeepSeek
- MiniMax
- Moonshot AI 등 중국 기업들이 Claude의 능력을 “불법으로 추출”했다고 공식 발표했다고 전한다. @[15:26][15:33]
조코딩은 미니맥스 등의 코딩 실력이 “어떻게 이렇게 잘하나” 싶었는데, Claude를 증류해 잘했던 것이라는 식으로 연결한다. @[15:38][15:43]
다만 방어/차단을 했다 해도 “막을 수 있나”라는 회의도 덧붙인다. API 응답을 해외 서버를 통해 받는 방식이면 가능하지 않겠냐는 의문을 제기하면서도, 앤트로픽은 막고 있다고 한다고 전달한다. @[15:43][15:48][15:53]
3.14 Qwen 3.5 Medium(플래시 27B/35B/122B): 소비자 GPU에서도 돌리는 ‘공짜’ 고성능 오픈소스 모델 군 @[15:53]
이어 “지난주 소개했던 Qwen 3.5”는 큰 모델만 있어 DGX Spark나 H100 같은 고급 GPU가 필요했는데, 이제 미디엄 모델 시리즈가 새로 나와 소비자용 GPU에서도 구동 가능해졌다고 말한다. @[15:53][16:00][16:05]
오픈소스로 공개되어 다운받아 공짜로 돌릴 수 있으며, 모델군으로
- Flash 27B
- 35B
- 122B 를 언급한다. “디스틸을 굉장히 잘한 건지 성능이 잘 나온다”고 평가한다. @[16:09][16:14][16:19][16:24]
비교에서는 GPT-5 mini 같은 소형 모델, 혹은 Claude Sonnet 3.5(?) 언급과 함께, Qwen 쪽이 전반적으로 “풀리지 않는다(성능이 잘 나온다)”는 식으로 표현하며, 이전 모델 대비 앞섰고 “6배 큰 모델들보다 성능이 앞선다”는 주장도 포함한다. 또한 Claude Sonnet 4.5가 얼마 전까진 SOTA처럼 보였는데 “뛰어넘었다”고 말한다. @[16:24][16:30][16:31][16:33][16:40]
특히 “코딩 엄청 잘하고 공짜로 돌릴 수” 있으며 “소비자형 GPU에서 돌아간다”는 점이 핵심이다. @[16:40][16:41]
구동 예: RTX 3090 단일로 35B 구동 + 멀티파일 게임 프로젝트 자율 구축
Qwen 3.5 35B는 RTX 3090 하나에서 바로 돌릴 수 있고, “전체 멀티파일 게임 프로젝트를 자율적으로 구축”했다고 한다. 또한 활성 파라미터가 3B밖에 안 된다고 말하며(아키텍처 특성: “MA라서 활성은 작게”), 그래서 생성이 빠를 것이라는 설명을 덧붙인다. 토큰 생성 속도도 꽤 빠르다고 언급. @[16:43][16:46][16:51][16:55][16:59][17:03]
외부 벤치 위치: Artificial Analysis 차트에서 27B가 폐쇄형 모델 사이에 위치
성능 비교로 Artificial Analysis의 전체 모델 성능 공개를 언급하며, Qwen 3.5 27B가 “쟁쟁한 클로즈드 모델들 사이”에 위치해 있다고 말한다. 작은 27B가 그 사이에 있다는 점을 임팩트로 전달한다. @[17:03][17:09][17:14]
3.15 Perplexity Computer: OpenWebUI류 ‘컴퓨터 모드’ 에이전트 작업 + 멀티모델(API) 활용 + 자동 쇼츠 편집까지 @[17:14]
퍼플렉시티가 Perplexity Computer를 출시했다고 한다. 조코딩은 이를 “오픈 클로의 퍼플렉시티 버전”이라고 비유한다. @[17:14][17:18]
컴퓨터 모드를 켜고 “엔비디아 조사해 줘” 같은 지시를 하면, 퍼플렉시티의 장점으로 다양한 API/모델을 나눠 쓰는 모습을 보여준다고 한다. 예로 GPT-5.2(1?)로 일부 조사, Claude Opus로 다른 부분 조사처럼 “모델별로” 나눠 쓰는 장면을 언급한다. @[17:23][17:27][17:31]
이렇게 컴퓨터 한 대를 빌려 에이전틱하게 조사→정리→엑셀 파일 생성까지 하는 흐름을 “오픈 클로 쓰듯이” 수행한다고 설명한다. @[17:31][17:36]
복잡한 자동화 데모: 팟캐스트 다운로드→클립 선별→세로 쇼폼 편집→자막/텍스트→틱톡용 영상 생성
컴퓨터가 있으니 가능한 예로, “다리오 아모데이 & 드와캐시 팟캐스트”를 다운받고, 다리오가 말한 부분을 찾아 클립을 나누고, 틱톡용 세로 영상으로 잘라 만들어 달라는 복잡한 작업을 시킨다. 결과는 다운로드/스트리밍/텍스트 삽입을 거쳐 쇼폼 영상이 “그냥 나와 버린다”며, “편집 완전 자동화”가 되는 사례로 제시한다. @[17:41][17:49][17:58][18:00]
이 기능은 “아마 맥스 플랜 대상으로 토큰 일정 부분” 제공 형태로 운영된다고 언급한다. @[18:00][18:03]
3.16 삼성 갤럭시 S26 ‘딥 레벨 통합’: Perplexity 검색 API가 빅스비 검색/추론을 강화 @[18:03]
최근 갤럭시 공개와 함께, 퍼플렉시티 검색 API가 삼성 갤럭시 S26 휴대폰에 “딥 레벨로 통합”됐다고 전한다. 즉 Perplexity Assistant가 빅스비의 검색·추론 능력을 강화하고, 빅스비로 검색할 일이 있으면 퍼플렉시티 API를 쓴다는 설명이다. @[18:06][18:09][18:13][18:18][18:22]
3.17 Cursor 업데이트: 변경 diff의 ‘영상’ 제작 + UI 테스트 영상 + 녹화 PC에 풀 액세스(클라우드 컴퓨터) @[18:22]
커서(Cursor)에서 새로운 기능이 나왔다며, 원래 diff(코드 변화)를 보여주던 것을 넘어 작업 영상을 직접 제작해 보내줄 수 있다고 소개한다. “이렇게 수정했어”를 영상으로 보여준다는 것. @[18:22][18:26][18:31]
또 AI가 UI를 조작하는 테스트를 수행하고, 그 과정을 영상으로 찍어 보내주는 것도 가능하다고 한다. @[18:37][18:39]
그리고 “풀 액세스 가능”을 강조한다. 설명 흐름은:
- 지금 화면 녹화를 하고 있는데,
- 녹화가 끝나면 “다음(단계로)” 그 녹화하던 컴퓨터로 들어갈 수 있다
- 즉 “클라우드 컴퓨터”를 바로 쓸 수 있다
는 식으로, Anthropic의 Computer Use나 오픈AI의 컴퓨터 띄워 작업하는 기능과 유사한 것을 Cursor가 도입했다고 말한다. 그 컴퓨터에서 수정/테스트까지 수행 가능하다는 점을 언급한다. @[18:41][18:46][18:51][18:55][18:59][19:02][19:06]
3.18 Mercury 2: 확산(Diffusion) 기반 초고속 LLM—1000 토큰/초, 128K 컨텍스트, JSON 출력 @[19:06]
머큐리 2 모델을 “확산 기반 초고속 LLM”이라고 소개한다. 확산 모델은 이미지 생성에서 노이즈에서 단계적으로 형태가 나타나는 방식인데, LLM도 디퓨전 기반으로 생성할 수 있다는 것이다. @[19:06][19:11][19:15][19:19]
이 방식은 “엄청 빠르게” 나오며, 한 번에 여러 토큰을 생성·수정하는 형태로 5배 이상 빠른 응답이 나온다고 한다. 구체적으로
- 1000 토큰/초 이상
- 128K 컨텍스트
- JSON 출력 이 가능한 디퓨전 기반 LLM이라고 언급한다. @[19:24][19:30]
직접 데모로 “조코딩을 소개하는 HTML 코드 작성”을 시키며 디퓨전 이펙트를 켜자, “1초도 안 걸렸다”, “진짜 빠르다”고 반응한다. @[19:38][19:43][19:45][19:48][19:51]
3.19 LavaSR: 초고속 오디오 개선—리얼타임의 5000배, CPU에서도 60배 빠름 @[19:51]
오디오 개선 모델로 Lava SR을 소개한다. “굉장히 작고 빠르다”고 하며,
- 5000배 리얼타임 처리(3초 음성을 0.00몇 초에 처리)
- CPU에서도 60배 빠름
이라고 말한다. 즉 실시간 음성 개선에 활용 가능하다는 관점이다. @[19:54][19:57][20:00][20:03]
데모로 영어 문장을 전/후로 들려주며 “좀 좋아진 걸 볼 수 있죠”라고 하고, 로우 퀄리티 녹음도 고품질로 빠르게 뽑을 수 있다고 설명한다. 작고 빠르니 CPU 기반 음질 개선 서비스에도 쓸 수 있다는 결론. @[20:03][20:11][20:15][20:19][20:23][20:27]
3.20 Sakana AI ‘Instant LLM / Doc2LoRA’: 문서를 LoRA로 만들어 추론에 ‘붙이는’ 새로운 문서 활용 방식(오픈소스) @[20:27]
사카나 AI를 “연구 자동화로 화제가 됐던 기업”이라 소개하며, Instant LLM 업데이트: Doc2LoRA가 나왔다고 말한다. @[20:27][20:31][20:35]
기존 문서 기반 추론/답변 방식은 대개
- 문서를 프롬프트에 직접 넣거나
- 벡터화 후 RAG로 검색/주입 인데, Doc2LoRA는 문서를 “LoRA 형태”로 만들어 언어 모델과 함께 붙여 추론하면 문서 기반 답변을 더 잘한다는 방식이라고 설명한다. @[20:41][20:47][20:54]
구체 흐름은 “다큐먼트 + 질문”으로 LoRA를 만들고, LLM에 LoRA를 붙이면 문서 기반 답변을 더 정확히 줄 수 있다는 것. 문서를 “가벼운 형태로 첨부”할 수 있어 더 많은 양을 처리할 수 있다는 기대도 덧붙인다. 그리고 이 기술은 오픈소스로 풀렸다고 한다. @[21:00][21:09][21:13]
3.21 잭 도시의 Block: AI 전환으로 40% 가까운 감원(1만→6000 이하), 주가 시간외 24% 급등—“성장해도 인원을 줄이는” 시대 @[21:13]
마지막 뉴스로 트위터 창업자 잭 도시가 설립한 Block이 AI 전환 때문에 4,000명 감원을 발표했다고 전한다. @[21:13][21:17][21:21]
규모는 원래 직원 1만 명에서 6,000명 이하로 축소, 즉 거의 40% 감원에 해당한다고 설명한다. @[21:25][21:29]
중요한 포인트는 “경영 위기 때문이 아니라”는 것. 회사는 총이익 성장, 고객 증가, 수익성 개선 중인데도 감원을 단행했다는 점을 강조한다. 즉 “기업이 잘 되는데도” 인건비를 크게 줄인 사례라는 것. @[21:29][21:33]
그 배경 문구로 “AI 기반 생산성이 회사 구축과 운영 방식을 근본적으로 재정의하는 단계에 진입”했다고 언급하며, 인건비가 줄어 수익성이 좋아지자 주가가 시간외 거래에서 24% 이상 급등했다고 말한다. @[21:44][21:51]
또한 아마존 등 다른 기업들도 계속 자른다는 맥락을 붙이며, 기업 입장에서는 점점 인원을 줄일 수밖에 없고, 남은 사람들은 AI로 생산성을 올려 살아남는 방법밖에 없지 않겠냐는 전망을 제시한다. @[21:54][21:57][22:01][22:04]
3.22 결론적 제안/홍보: “1인 창업의 시대” 대비—바이브 코딩 부트캠프 + MWC 라이브 예고 @[22:04]
조코딩은 이런 시대 변화에 대비하려면 “1인 창업의 시대”라고 말하며, 기업이 개인을 책임져주지 않으니 기획부터 첫 수익, 결제, SaaS 반복 매출, 미국 법인/Stripe Atlas까지 가능한 역량이 필요하다고 주장한다. @[22:04][22:10][22:14][22:19]
이를 위해 자신이 만든 “바이브 코딩 1인 창업 부트캠프(3시간짜리)” 영상을 안내하며, 멤버십에 무료 파트도 있다고 말한다. @[22:07][22:25][22:28][22:31]
또한 MWC(모바일 월드 콩그레스) 컨퍼런스에 LG U+ 후원으로 참여하며, 한국 시간 월요일 밤 10시에 부스 투어 라이브를 진행해 기술(아마 AI 중심)을 보여주겠다고 예고한다. 영상 말미에는 좋아요 요청과 감사 인사로 마무리된다. @[22:34][22:37][22:42][22:46][22:48][22:54][22:59]
4. 핵심 통찰
-
“성능 경쟁”의 무게중심이 ‘품질’에서 ‘속도·단가·통합’으로 이동
나노바나나 2는 프로급에 근접한 결과를 더 빠르고 저렴하게 제공하며(0.5K 0.045달러, 4K 0.15달러 등), Flow/Stitch처럼 제품군에 깊게 통합된다. 사용자는 “최고 품질 1장”보다 “충분히 좋은 품질을 빠르게 대량 생산”하는 쪽으로 유인이 커진다. @[00:16][01:14][02:20][03:24] -
에이전트의 다음 단계는 ‘컴퓨터를 빌려 실제 작업을 수행’하는 형태
Perplexity Computer가 조사→파일 생성→쇼츠 편집 같은 복합 워크플로를 수행하고, Cursor도 클라우드 컴퓨터 접근/테스트 자동화로 이어진다. 모델이 답변만 하는 것이 아니라, “도구를 조작해 산출물을 만드는 것”이 표준이 되어간다. @[17:31][17:49][18:41][19:02] -
AI 사용 리스크는 이제 기술이 아니라 ‘정책/정지/공급 제한/안보 갈등’으로도 발생
구글의 외부 OAuth 연동 밴은 “유료(월 249달러)도 예외 없다”는 불안정성을 보여주고, 앤트로픽-국방부 갈등은 “국가가 요구하는 사용처”와 “기업의 윤리 조건”이 충돌할 때 공급이 차단될 수 있음을 보여준다. 사용자는 도구 선택에서 정책 리스크를 핵심 변수로 고려해야 한다. @[03:49][04:42][11:36] -
오픈소스·소비자 GPU 모델의 질적 상승은 ‘접근성의 민주화’이자 ‘보안/증류 전쟁’의 촉매
Qwen 3.5 Medium이 3090 단일로 돌아가고, 성능이 폐쇄형 모델 사이에 위치할 정도로 올라오면, 개인·소규모 팀도 강력한 코딩/추론을 로컬에서 굴릴 수 있다. 동시에 앤트로픽이 중국 기업들의 증류를 탐지했다는 발표처럼, 모델 능력은 계속 ‘추출’ 시도에 노출된다. @[16:46][17:09][15:12][15:33] -
인력 구조 변화: “성장해도 채용이 늘지 않는” 경영 논리가 확산
Block의 40%에 가까운 감원과 주가 급등 사례는, AI 생산성이 실제로 비용 구조를 바꾸고 있고 시장이 이를 보상한다는 신호로 제시된다. 영상은 이를 “1인 창업/개인 생존 전략”과 연결한다. @[21:29][21:51][22:04]
5. 헷갈리는 용어 정리 (해당 시에만)
- Flash 모델 / Pro 모델: 영상 맥락에서 Flash는 “가볍고 빠르고 저렴”한 계열, Pro는 “더 고품질이지만 느리고 비쌈”으로 대비되어 설명된다. @[00:09][00:16][01:53]
- SVG: 선/점 기반의 벡터 이미지 포맷. 해상도에 덜 의존하고 편집(점 이동 등)이 가능하며 웹에 그대로 삽입 가능하다고 설명한다. @[05:56][06:57]
- 벡터라이즈(Vectorize): 비트맵 이미지를 벡터(SVG) 형태로 변환하는 기능/과정으로 소개된다. @[06:39][06:43]
- Remote Control(Claude Code):
/remote-control명령으로 Claude 앱과 연동하여 밖에서도 집 컴퓨터 작업을 이어가게 하는 원격 제어 모드. @[07:14][07:32] - Agent.md(컨텍스트 파일): AI 코딩 에이전트에게 프로젝트 규칙/도구/지침을 제공하는 파일 관행. 중복 정보를 과하게 넣으면 비용 20% 증가 및 성능 저하 가능성이 언급된다. @[08:50][09:15]
- 증류(Distillation): 더 강한 모델의 응답을 대량으로 받아 더 작은/다른 모델을 학습시키는 방식. 앤트로픽은 중국 기업들이 Claude를 불법 추출해 증류했다고 발표했다고 전한다. @[15:12][15:19]
- RAG: 문서를 벡터화해 검색으로 관련 내용을 가져와 프롬프트에 넣는 일반적 방식으로, Doc2LoRA와 대비되는 기존 접근으로 언급된다. @[20:47]
- LoRA: 파인튜닝을 가볍게 붙이는 추가 가중치 형태. Doc2LoRA는 문서를 LoRA로 만들어 LLM 추론에 부착하는 방식으로 설명된다. @[20:35][21:09]
- 확산(Diffusion) 기반 LLM: 이미지처럼 노이즈에서 점진적으로 생성하는 확산 아이디어를 텍스트 생성에 적용한 모델로 Mercury 2가 소개된다. 다수 토큰을 한 번에 생성/수정해 매우 빠르다고 설명한다. @[19:11][19:24]
참고(콘텐츠 정보)
- 제목: AI뉴스 - 나노바나나2, QuiverAI Arrow, Perplexity Computer, 클로드 Remote Control, 미국방부 갈등, Qwen-3.5 시리즈 등
- 채널: 조코딩 JoCoding
- 길이: 23분 12초
- URL: https://www.youtube.com/watch?v=3MnrLvUR-DI
- 제공된 타임스탬프 기반으로 내용 재구성 및 문장 인용 표시: @[00:00] ~ @[23:02]