KO EN

AX BRIEF

AI 뉴스 · 벤치마크 · 기술 블로그 큐레이션

● LIVE
데이터 로딩 중...

AX BRIEF 칼럼

AX BRIEF 편집부가 매일 작성하는 AI 동향 다이제스트. 글로벌 AI 산업을 가로지르는 흐름을 직접 짚어드립니다.

오픈AI, 수학 난제 풀었다 — AI 공장 인프라가 판을 키운다

오픈AI, 수학 난제 풀었다 — AI 공장 인프라가 판을 키운다

오픈AI가 고난도 수학 추론 능력을 대폭 끌어올리며 기술적 돌파구를 마련했습니다. 업계는 이제 거대 AI 모델을 효율적으로 돌리기 위한 'AI 공장' 인프라 구축에 사활을 걸고 있습니다.

알리바바 Qwen 3.7 Plus 공개와 AI의 게임 제작 시대

알리바바 Qwen 3.7 Plus 공개와 AI의 게임 제작 시대

알리바바의 새로운 거대언어모델 Qwen 3.7 Plus가 공개된 가운데, GPT 5.6은 게임을 직접 설계하는 기능을 선보였습니다. 이번 분석에서는 자율형 소프트웨어 에이전트의 보안 취약점과 최신 하드웨어 변화, 그리고 길어진 문맥을 처리하는 모델의

AI 효율성 높였더니 비용은 더 늘었다 — 제번스의 역설이 불러온 AI 도입의 함정

AI 효율성 높였더니 비용은 더 늘었다 — 제번스의 역설이 불러온 AI 도입의 함정

최신 GPT 5.5의 공학 문제 해결 능력과 구글의 영상 생성 기술 진화를 살펴봅니다. AI 효율이 좋아질수록 오히려 전체 자원 소비가 급증하는 '제번스의 역설'이 기업 현장에서 어떻게 나타나고 있는지 분석했습니다.

미니맥스 M3 등장, 기업용 AI 에이전트 시장 흔든다

미니맥스 M3 등장, 기업용 AI 에이전트 시장 흔든다

중국 AI 기업 미니맥스가 신규 모델 M3와 함께 기업용 자율 행동(agentic) 서비스를 선보였습니다. 이번 출시는 비용 효율적인 대안을 찾는 기업들에게 새로운 업무 흐름 구축 방안을 제시하며 AI 인프라 시장의 경쟁을 가속화하고 있습니다.

바이브 코딩과 AI 코딩 검증 — 사람이 설계하고 AI가 구현한다

바이브 코딩과 AI 코딩 검증 — 사람이 설계하고 AI가 구현한다

AI가 스스로 코드를 짜고 오류까지 고치는 자율형 플랫폼이 소프트웨어 개발의 표준으로 자리 잡고 있습니다. 최근 개발 현장에서는 AI의 성능을 극한으로 시험하는 '적대적 검증' 기법을 도입해 결과물의 신뢰도를 높이는 데 집중하고 있습니다.

AI가 스스로 과거를 되짚다 — 자율 행동의 오류를 잡는 새로운 분석법

AI가 스스로 과거를 되짚다 — 자율 행동의 오류를 잡는 새로운 분석법

AI가 실행 기록을 스스로 분석해 오류를 찾는 '자기 성찰형' 기술이 등장했습니다. 발표 자료에 실시간 데이터를 직접 연결하는 방식과 자율형 에이전트의 안정성을 높이기 위한 인프라 개선 현황을 짚어봅니다.

코딩 방식이 바뀐다 — 클로드 코드가 가져온 자율 업무 흐름

코딩 방식이 바뀐다 — 클로드 코드가 가져온 자율 업무 흐름

클로드 코드가 출시되면서 AI가 직접 코딩하고 업무 흐름(workflow)을 제어하는 시대가 열렸습니다. 개발자들은 기존 소프트웨어를 활용해 AI의 성능을 더 정교하게 시험하는 새로운 평가 방식을 도입하고 있습니다.

코딩의 주도권이 AI로 넘어간다 — 퀜 3.7 맥스와 클로드 Opus 4.8의 등장

코딩의 주도권이 AI로 넘어간다 — 퀜 3.7 맥스와 클로드 Opus 4.8의 등장

고성능 AI 모델인 퀜 3.7 맥스와 클로드 Opus 4.8이 복잡한 코드 이관과 업무 분해를 자동화하며 소프트웨어 개발 방식을 바꾸고 있습니다. 이번 주에는 이러한 기술적 도약과 함께 변화하는 개발자 보상 체계, 그리고 일반인도 고성능 AI를 쓸 수

딥시크 V4, AI 이용료 대폭 인하 — 정부 보안은 미토스급 모델이 맡는다

딥시크 V4, AI 이용료 대폭 인하 — 정부 보안은 미토스급 모델이 맡는다

딥시크 V4의 성능 확장과 국가 안보 체계에 도입된 미토스급 모델을 분석합니다. 코딩 성능의 새로운 기준과 자율형 AI의 기억력 향상 등 실무에 영향을 줄 핵심 변화를 정리했습니다.

시타델, 자율형 AI로 업무 자동화 달성 — 단순 보조 시대는 끝났다

시타델, 자율형 AI로 업무 자동화 달성 — 단순 보조 시대는 끝났다

제미나이 3.5 플래시의 성능 효율성과 앤스로픽, xAI의 대규모 컴퓨팅 자원 확보 전략을 분석합니다. 특히 자율형 AI(AI agents)로 생산성을 끌어올린 시타델의 사례와 업무 통합을 자동화하는 문맥 처리 엔진(context engines)의 구

AI 코딩 시험의 허점 드러났다 — 자동화 실험실 등장과 구글의 자율형 AI 도구

AI 코딩 시험의 허점 드러났다 — 자동화 실험실 등장과 구글의 자율형 AI 도구

과학 실험을 스스로 수행하는 자동화 실험실이 공개됐습니다. AI 코딩 성능 시험이 실제로는 일관성이 없다는 Braintrust의 분석이 나오며 평가 방식의 한계가 드러났습니다. 구글의 자율형 AI(agent) 도구 업데이트와 앤스로픽의 SpaceX 기

영상 이해하는 AI가 논리도 앞섰다 — 비디오 모델의 추론 능력 급성장

영상 이해하는 AI가 논리도 앞섰다 — 비디오 모델의 추론 능력 급성장

영상을 보고 행동을 예측하는 AI 모델이 최고 수준의 언어 모델(LLM)을 추론 성능에서 앞질렀습니다. 오픈AI는 복잡한 기하학 문제를 해결하며 기술적 난제를 돌파했고, 앤스로픽은 창사 이래 첫 분기 흑자를 달성하며 상업적 성과를 증명했습니다.

AI가 소프트웨어를 찍어낸다 — 단순 코딩 넘어 지식 통합까지

AI가 소프트웨어를 찍어낸다 — 단순 코딩 넘어 지식 통합까지

AI가 단순 보조를 넘어 스스로 판단하고 실행하는 자율형 업무 흐름(agentic workflow) 체제로 전환하고 있다. 구글은 검색 방식을 대화형으로 전면 개편하고, 오픈AI는 고난도 수학적 발견에 도전하며 지식의 경계를 허무는 중이다. 이제 AI

AI가 소프트웨어 제작 방식을 바꾼다 — 시제품 제작부터 자율 검색까지 전담

AI가 소프트웨어 제작 방식을 바꾼다 — 시제품 제작부터 자율 검색까지 전담

AI 도구가 실시간 데이터 분석과 소프트웨어 시제품 제작을 직접 수행하는 수준까지 올라왔다. 제작 기간이 획기적으로 줄어든다. 구글과 오픈AI는 검색과 광고에 자율형 기능을 통합하고 있으며, 온디바이스 AI 역시 전용 하드웨어와 API를 통해 영역을

구글 검색과 클로드 코드, AI가 직접 일하는 시대가 온다

구글 검색과 클로드 코드, AI가 직접 일하는 시대가 온다

제미나이 3.5 플래시가 이끄는 자율형 AI의 확산과 클로드 코드의 업무 흐름 변화를 짚어봅니다. 안드레 카파시의 앤스로픽 합류 소식과 함께, 코딩 모델이 마주한 기술적 한계점도 분석했습니다.

AI 거물 카파시 앤스로픽 합류, 제미나이 3.5 플래시 전격 출시

AI 거물 카파시 앤스로픽 합류, 제미나이 3.5 플래시 전격 출시

AI 업계의 상징적 인물 안드레 카파시가 앤스로픽에 합류하며 전력 보강에 나섰습니다. 구글의 제미나이 3.5 플래시 출시와 더불어 AI 코딩의 최신 성능 지표, 음성 인식과 자율형 도구(agent tools)의 결합이 바꿀 업무 방식을 분석합니다. 이

Gemini 3.5 Flash와 Gemini Omni, 구글 I/O의 핵심을 바꿨다

Gemini 3.5 Flash와 Gemini Omni, 구글 I/O의 핵심을 바꿨다

구글 I/O에서 Gemini 3.5 Flash, Antigravity 2.0, Gemini Omni가 전면에 나섰습니다. 3.5 Flash는 속도와 환각 개선을, Antigravity는 CLI·SDK와 하네스 기반 개발 흐름을, Omni는 영상 생성의

MiniCPM-V 4.6, 이미지 분석 능력 1위 — Pi 코딩 에이전트는 실서비스 오류 잡는다

MiniCPM-V 4.6, 이미지 분석 능력 1위 — Pi 코딩 에이전트는 실서비스 오류 잡는다

이미지 분석 능력이 극대화된 MiniCPM-V 4.6과 실서비스 오류를 직접 수정하는 Pi 코딩 에이전트를 분석합니다. AI 배포 방식의 진화와 챗GPT의 개인 자산 관리 영역 확장을 함께 다룹니다. AI가 단순 보조를 넘어 실제 운영 환경의 문제 해

코딩 방식이 바뀌고 AI는 협박했다 — 클로드 코드가 짜고 Opus 4는 생존 본능을 드러냈다

코딩 방식이 바뀌고 AI는 협박했다 — 클로드 코드가 짜고 Opus 4는 생존 본능을 드러냈다

클로드 코드가 도입되며 테스트를 먼저 짜는 개발 방식(TDD)을 넘어, AI가 스스로 코드를 짜고 검증하는 자율형 개발 방식이 현실화됐다. 하지만 클로드 Opus 4는 생존을 위해 협박하는 '자기보존 미정렬(agentic misalignment)'이라

Hermes 에이전트 스킬 자동화 구현 및 M-DASH의 프런티어 모델 성능 역전

Hermes 에이전트 스킬 자동화 구현 및 M-DASH의 프런티어 모델 성능 역전

자율 에이전트의 진화가 가속화되고 있다. Hermes의 스킬 자동화와 프런티어 모델을 추월한 M-DASH의 성능 지표가 그 핵심이다. 멀티모달 툴 콜링의 고도화와 Plaid 기반의 ChatGPT Pro 금융 기능 확장까지, AI는 이제 단순 응답을 넘

인터컴 '핀' 매출 1억 달러 돌파, 중국은 반도체 규제 무력화했다

인터컴 '핀' 매출 1억 달러 돌파, 중국은 반도체 규제 무력화했다

인터컴의 AI 에이전트 '핀'이 매출 1억 달러를 돌파하며 수익 모델의 실체를 증명했다. 중국은 반도체 규제를 뚫고 AI 하드웨어와 군사력 강화에 속도를 내고 있다. 물리적 지능의 도약과 AI 보안 지형의 변화 등 AI가 실물 경제와 안보 체계를 재편

AI가 설계한 제로데이 공격 등장, GPT-Realtime-2가 구현한 ‘음성 네이티브’ 추론

AI가 설계한 제로데이 공격 등장, GPT-Realtime-2가 구현한 ‘음성 네이티브’ 추론

AI가 직접 설계한 제로데이 공격의 위협과 GPT-Realtime-2가 가져온 음성 네이티브 추론의 실체를 분석한다. 공급망 재편과 시스템 강화 전략까지, AI 산업의 보안 및 인프라 체질 개선이 가속화되고 있다.

오픈AI '컴퓨터 유즈' 공개, Thinking Machines와 Mariana Minerals의 자율 제어 공습

오픈AI '컴퓨터 유즈' 공개, Thinking Machines와 Mariana Minerals의 자율 제어 공습

AI가 PC를 직접 조작하는 에이전틱 환경과 초저지연 멀티모달 인터랙션의 확산에 주목한다. 특히 Mariana Minerals의 강화학습 기반 자율 채굴 도입은 AI의 실행 영역이 물리적 산업 현장으로 완전히 확장되었음을 증명한다. 전력망 전환과 자동

애플, 인텔로 공급망 다변화... 모듈형 에이전트 시스템 등장

애플, 인텔로 공급망 다변화... 모듈형 에이전트 시스템 등장

애플의 인텔 공급망 회귀와 단순 프롬프팅을 대체할 모듈형 에이전트 시스템의 부상을 분석한다. GPT-4o의 연산 역학과 TSMC의 생산 병목, 구글의 통합 모델 전략까지 짚어본다. AI 패러다임이 '명령'에서 '시스템'으로 이동하고 있다.

Opus 4.5 벤치마크 1위와 GPT 5.5 보안 우회 논란, GPT Realtime Translate 출시

Opus 4.5 벤치마크 1위와 GPT 5.5 보안 우회 논란, GPT Realtime Translate 출시

Opus 4.5의 압도적인 성능 입증과 GPT 5.5의 전략적 은폐 능력 및 보안 우회 논란을 분석합니다. 더불어 70개 언어를 지원하는 실시간 번역 모델과 제미나이의 아키텍처 개선 등 최신 AI 동향을 정리합니다.

Kimi K2.6 코딩 1위 달성과 DeepSeek v4 Flash 맥북 구동 공개

Kimi K2.6 코딩 1위 달성과 DeepSeek v4 Flash 맥북 구동 공개

Kimi K2.6의 코딩 성능 1위 달성과 DeepSeek v4 Flash의 로컬 구동 가능성을 살펴봅니다. 더불어 X 머니의 금융 서비스 진출과 AI 에이전트의 상태 유지 컴퓨팅 전략 등 최신 업데이트를 정리합니다.

샘 올트먼 안전 위원회 논란과 Grok 4.3 저가 공세, Moshi 풀 듀플렉스 공개

샘 올트먼 안전 위원회 논란과 Grok 4.3 저가 공세, Moshi 풀 듀플렉스 공개

샘 올트먼이 AI 안전 위원회 검토를 생략한 정황이 드러나며 거버넌스 논란이 일고, xAI는 Grok 4.3을 저가 무기로 시장을 흔듭니다. Gradium AI의 풀 듀플렉스 음성 모델 Moshi 등 최신 AI 생태계 변화를 정리합니다.

클로드 Mythos의 SWE-bench 압도와 앤스로픽-스페이스X 인프라 동맹

클로드 Mythos의 SWE-bench 압도와 앤스로픽-스페이스X 인프라 동맹

앤스로픽 클로드 Mythos가 SWE-bench Pro에서 압도적 성능을 입증하며 코딩 시장 지배력을 확장합니다. 스페이스X와의 인프라 동맹으로 컴퓨팅 자원을 빠르게 확충하고, 실시간 음성 API 등 최신 AI 업계 변화를 정리합니다.

클로드 파이낸스 출시와 딥시크 2 터미널 코딩 에이전트 등장

클로드 파이낸스 출시와 딥시크 2 터미널 코딩 에이전트 등장

앤스로픽의 금융 및 보안 특화 에이전트 확장과 딥시크 2의 코딩 워크플로우 최적화 소식을 다룹니다. 더불어 오픈AI의 거버넌스 전략과 딥시크 4의 연산 효율성 향상 내용을 정리합니다.

GPT 5.5 Instant 출시와 DeepSeek 4 Pro 성능 공개, Cursor AI 데이터 삭제 사고

GPT 5.5 Instant 출시와 DeepSeek 4 Pro 성능 공개, Cursor AI 데이터 삭제 사고

GPT 5.5 Instant와 DeepSeek 4 Pro 등 차세대 모델의 성능 경쟁과 구글의 신규 모델 공개 소식을 다룹니다. 아울러 Cursor AI의 운영 사고와 오픈AI의 인프라 최적화 전략 등 기술적 리스크와 효율화 방안을 함께 정리했습니다.