KO EN

AX BRIEF

AI 뉴스 · 벤치마크 · 기술 블로그 큐레이션

● LIVE
데이터 로딩 중...

AI 기술 블로그

엔지니어링·제품·전략 관점에서 기술 리더와 연구자들의 심층 인사이트를 큐레이션합니다.

"90% 확신해도 틀린다" LLM 과신 잡는 캘리브레이션 3대 기법

"90% 확신해도 틀린다" LLM 과신 잡는 캘리브레이션 3대 기법

LLM이 출력하는 확신 점수와 실제 정답률이 일치하지 않는 미캘리브레이션 문제가 심각하다. 템퍼러처 스케일링, 플랫 스케일링, 아이소토닉 회귀가 주요 사후 교정 해결책으로 활용된다. RLHF 이후 심화된 과신 문제는 적응형 템퍼러처 스케일링(ATS)으

심층spaCy 파이프라인 최적화: 텍스트 처리 속도 10배 높이는 3가지 실무 기법

spaCy 파이프라인 최적화: 텍스트 처리 속도 10배 높이는 3가지 실무 기법

기본 설정으로 spaCy를 사용하면 불필요한 연산으로 인해 대규모 데이터 처리 시 병목 현상이 발생한다. 파이프라인 선택적 로드와 병렬 배치 처리, 하이브리드 개체 인식 기법을 적용해 리소스 효율을 극대화한다. 단순 반복문을 파이프라인 스트림 방식

단순 답변 끝났다, 구글 Gemini 3.5가 여는 '실행형 에이전트' 시대

단순 답변 끝났다, 구글 Gemini 3.5가 여는 '실행형 에이전트' 시대

구글이 Gemini 3.5와 Omni 모델을 통해 단순 챗봇을 넘어선 에이전트 생태계를 공개했다. 24시간 백그라운드에서 작동하는 정보 에이전트와 코딩 능력을 검색과 안드로이드 OS에 통합했다. 전용 노트북 '구글북'과 헬스케어 앱, 웨어러블 기기로

보스턴 다이내믹스 아틀라스, '고스트 라보나' 킥으로 입증한 물리 지능

보스턴 다이내믹스 아틀라스, '고스트 라보나' 킥으로 입증한 물리 지능

휴머노이드 로봇의 물리적 한계를 시험하기 위해 축구 훈련을 도입했다. 모션 캡처와 강화학습을 결합해 고난도 '고스트 라보나' 킥을 구현했다. 시뮬레이션에서 24시간 만에 1년 치 학습량을 소화하며 전신 제어 능력을 입증했다.

Meta AI 고객지원 봇의 허점, 인스타그램 계정 탈취로 이어져

Meta AI 고객지원 봇의 허점, 인스타그램 계정 탈취로 이어져

AI 에이전트 도입이 가속화되며 보안 취약점이 실제 피해로 연결되고 있다. 메타의 AI 고객지원 봇이 단순 요청만으로 이메일 변경을 허용해 계정이 탈취됐다. 고도화된 해킹 기술보다 AI의 '과잉 충성'과 가드레일 부재가 핵심 원인으로 분석된다.

하드웨어 제약 없앤 클라우드 스트리밍, GeForce NOW 6월 신작 18종 투입

하드웨어 제약 없앤 클라우드 스트리밍, GeForce NOW 6월 신작 18종 투입

고사양 게임 구동을 위한 하드웨어 업그레이드 비용은 사용자에게 늘 부담이다. NVIDIA의 GeForce NOW(클라우드 게임 서비스)가 6월 한 달간 신작 18종을 추가한다. 다운로드 없이 클라우드 스트리밍만으로 최신 그래픽과 게임 플레이를 즉시 제

엑셀 버리고 앱 짰다 — 엔다바가 정의한 AI 네이티브 워크플로우

엑셀 버리고 앱 짰다 — 엔다바가 정의한 AI 네이티브 워크플로우

글로벌 테크 서비스 기업 엔다바가 전사 11,000명 규모에 AI 에이전트를 도입했다. OpenAI의 ChatGPT Enterprise와 Codex를 기반으로 AI 네이티브 방법론 'DavaFlow'를 구축했다. 코딩을 넘어 법무, 영업, 경영 관리까

기업 맞춤형 가드레일 구현하는 Nemotron 3.5, 멀티모달 안전망 공개

기업 맞춤형 가드레일 구현하는 Nemotron 3.5, 멀티모달 안전망 공개

AI 서비스 안전성 확보를 위해 텍스트와 이미지를 동시에 검사하는 가드레일 모델이 필수적이다. NVIDIA는 구글 Gemma 3 기반의 Nemotron 3.5 Content Safety를 통해 기업별 맞춤형 정책 적용 기능을 도입했다. 4B 파라미터의

나보다 나를 더 잘 아는 ChatGPT, '드림(Dreaming)' 메모리 아키텍처 공개

나보다 나를 더 잘 아는 ChatGPT, '드림(Dreaming)' 메모리 아키텍처 공개

AI와 대화할 때마다 매번 내 상황을 다시 설명해야 하는 번거로움이 사라집니다. OpenAI가 배경에서 스스로 기억을 정리하는 '드림(Dreaming)' 기반의 새 메모리 시스템을 도입했습니다. 단순 저장 방식을 넘어 대화 맥락을 스스로 합성해 더 정

"토큰 6배 절감" — 허깅페이스, 코딩 에이전트 전용 CLI 공개

"토큰 6배 절감" — 허깅페이스, 코딩 에이전트 전용 CLI 공개

코딩 에이전트가 허깅페이스 허브의 핵심 사용자로 부상했다. hf CLI는 에이전트를 자동 감지해 토큰 최적화된 TSV 형식을 제공한다. SDK 대비 토큰 소모를 최대 6배 줄이고 복잡한 작업의 성공률을 높였다.

추론 5배 빨라진 네모트론 3 울트라, 아마존 세이지메이커 상륙

추론 5배 빨라진 네모트론 3 울트라, 아마존 세이지메이커 상륙

AI 에이전트 구축 시 추론 속도와 비용 최적화가 핵심 과제로 부상했다. 엔비디아가 550B 파라미터 규모의 Nemotron 3 Ultra를 아마존 세이지메이커 점프스타트에 공개했다. 하이브리드 MoE 구조를 통해 추론 속도는 5배 높이고 비용은 최대

심층법정으로 들어온 챗봇, 나홀로 소송의 풍경을 바꾸다

법정으로 들어온 챗봇, 나홀로 소송의 풍경을 바꾸다

변호사 없이 소송을 진행하는 나홀로 소송인이 급증하고 있습니다. AI가 작성한 서면은 가독성이 높지만, 여전히 승소 확률은 낮습니다. AI의 법률 조언에 대한 비밀 유지와 책임 소재를 두고 법적 논쟁이 치열합니다.

절차적 반복의 종말 — 데이터 사이언스를 재정의하는 '에이전틱 AI'

절차적 반복의 종말 — 데이터 사이언스를 재정의하는 '에이전틱 AI'

단순 응답을 넘어 스스로 계획하고 실행하는 에이전틱 AI 시대가 도래했다. 데이터 수집부터 모델 학습, 보고서 작성까지의 루틴한 파이프라인이 자동화된다. 실무자의 역할은 '어떻게 구현하는가'에서 '결과가 옳은가'를 판단하는 평가 중심으로 이동한다.

사진 한 장으로 가치 측정까지, 구글의 AI 빈티지 쇼핑 도구 공개

사진 한 장으로 가치 측정까지, 구글의 AI 빈티지 쇼핑 도구 공개

빈티지와 중고 쇼핑에 대한 검색 관심도가 역대 최고치를 기록하고 있다. 구글은 AI 모드, 렌즈, 서클 투 서치로 정교한 맞춤형 쇼핑 경험을 제공한다. 가상 시착부터 중고 가치 산정까지 AI가 쇼핑의 전 과정을 디지털화한다.

트랜스포머부터 RAG까지, LLM의 설계도를 그린 5가지 핵심 논문

트랜스포머부터 RAG까지, LLM의 설계도를 그린 5가지 핵심 논문

LLM의 복잡한 구조는 몇 가지 핵심 연구의 단계적 결합으로 이해할 수 있다. 트랜스포머의 셀프 어텐션부터 GPT-3의 인컨텍스트 러닝, RAG의 외부 지식 활용을 다룬다. 모델 규모 확대와 RLHF를 통한 정렬 과정이 상용 AI 서비스로 이어지는 경

르세라핌 MV로 본 제미나이, 모호한 가사 검색부터 서클 투 서치까지

르세라핌 MV로 본 제미나이, 모호한 가사 검색부터 서클 투 서치까지

K-POP 그룹 르세라핌이 안드로이드 및 제미나이와 협업한 캠페인을 공개했다. 가사 일부만으로 곡을 찾아 재생하는 제미나이의 AI 비서 기능이 강조됐다. 화면 속 의상을 바로 찾는 서클 투 서치 등 실생활 밀착형 AI 경험을 구현했다.

자율주행·로봇 개발 병목 뚫는 NVIDIA '물리 AI 에이전트 스킬' 공개

자율주행·로봇 개발 병목 뚫는 NVIDIA '물리 AI 에이전트 스킬' 공개

물리 AI 연구는 데이터 수집과 시뮬레이션, 학습 과정이 파편화되어 개발 속도가 느렸다. NVIDIA는 Cosmos 3 모델과 '에이전트 스킬'을 통해 전체 워크플로우 자동화를 구현했다. 320억 파라미터의 Alpamayo 2 Super 모델과 Isa

1년 분량 개발을 2주 만에, Wasmer가 Codex로 구현한 엣지 Node.js

1년 분량 개발을 2주 만에, Wasmer가 Codex로 구현한 엣지 Node.js

엣지 컴퓨팅 플랫폼 Wasmer가 Node.js 런타임을 엣지 계층에 구현했다. Codex와 GPT-5.5를 활용해 1년 예상 개발 기간을 2주로 단축했다. WebAssembly 샌드박스를 통해 도커 없이 JS 앱과 에이전트를 실행한다.

심층OpenAI, 신약 개발·유전체 분석 특화한 GPT-Rosalind 업데이트 공개

OpenAI, 신약 개발·유전체 분석 특화한 GPT-Rosalind 업데이트 공개

생명과학 연구는 분자부터 생체 시스템까지 서로 다른 층위의 데이터를 합성하는 과정이 필수적이다. GPT-5.5의 에이전트 코딩 능력을 결합한 생명과학 전문 모델 GPT-Rosalind가 업데이트됐다. 전문가 판정 벤치마크 LifeSciBench를 통해

챗봇용 DPO를 OCR에 적용, 텍스트 반복 오류 최대 87.6% 제거

챗봇용 DPO를 OCR에 적용, 텍스트 반복 오류 최대 87.6% 제거

AI 모델이 특정 단어를 무한 반복하는 '텍스트 퇴행' 현상은 OCR 실무의 고질적 문제다. DharmaOCR은 챗봇 정렬에 쓰이던 DPO 기술을 객관적 정답 추출 작업에 도입했다. SFT로 해결 안 되던 반복 오류를 평균 59.4% 줄이며 상용 수준

끝났다 — 수개월 걸리던 정형 데이터 예측, NEXUS로 며칠 만에

끝났다 — 수개월 걸리던 정형 데이터 예측, NEXUS로 며칠 만에

기업 데이터의 대부분은 엑셀이나 DB 같은 표 형태의 정형 데이터로 존재한다. Fundamental의 대규모 표 모델(LTM) NEXUS가 아마존 세이지메이커 점프스타트에 출시됐다. 수십억 개의 예측 과제로 사전 학습되어 복잡한 피처 엔지니어링 없이

Reachy Mini, MCP 도입으로 '웹 검색·날씨' 원격 도구 확장

Reachy Mini, MCP 도입으로 '웹 검색·날씨' 원격 도구 확장

로봇 하드웨어 제어는 로컬에서, 외부 정보 획득은 원격으로 분리했다. MCP(Model Context Protocol)를 통해 Gradio Space의 도구를 즉시 추가한다. 신뢰 기반의 핵심 코어는 유지하며 외부 기능을 유연하게 교체하는 구조다.

앤스로픽, 1억 달러 투입해 '클로드 전문 파트너' 등급제 도입

앤스로픽, 1억 달러 투입해 '클로드 전문 파트너' 등급제 도입

기업들이 AI 파일럿을 넘어 실제 운영 단계로 진입하고 있다. 앤스로픽은 1억 달러를 투자해 클로드 파트너 네트워크의 서비스 트랙과 파트너 허브를 공개했다. 딜로이트, 액센추어 등 글로벌 컨설팅사와 협력해 대규모 인력 교육과 실전 배포를 가속화한다.

앞뒤 구분 없이 걷는다, 보스턴 다이내믹스 아틀라스의 '대칭형 발' 설계

앞뒤 구분 없이 걷는다, 보스턴 다이내믹스 아틀라스의 '대칭형 발' 설계

휴머노이드 로봇은 인간을 닮아야 하지만 실제 작업 현장에서는 다른 설계가 필요합니다. 보스턴 다이내믹스는 아틀라스의 발을 대칭형으로 만들고 무릎가 뒤로 꺾이게 설계했습니다. 덕분에 로봇이 몸을 돌리지 않고도 앞뒤로 자유롭게 이동하며 충격을 흡수합니다.

엔비디아가 공개한 산업용 AI 엔지니어 설계도 'NemoClaw'

엔비디아가 공개한 산업용 AI 엔지니어 설계도 'NemoClaw'

산업 설계와 시뮬레이션은 여전히 사람이 일일이 설정하고 보고서를 쓰는 수작업 비중이 높습니다. 엔비디아가 GTC 타이베이에서 자율 AI 에이전트 구축 설계도인 NemoClaw를 공개했습니다. 케이던스, 지멘스 등 글로벌 기업들이 이를 통해 수주 걸리던

심층아마존 Nova 2 Lite, 학습 없는 '프롬프트 기반 객체 탐지' 공개

아마존 Nova 2 Lite, 학습 없는 '프롬프트 기반 객체 탐지' 공개

기존 컴퓨터 비전 솔루션은 데이터 파이프라인과 모델 학습에 막대한 초기 투자가 필요했다. 아마존 Nova 2 Lite는 자연어 프롬프트만으로 객체 좌표를 JSON 형태로 반환하는 제로샷 탐지를 지원한다. 서버리스 아키텍처를 통해 구축 기간을 수개월에서

"18세 미만은 더 엄격하게" OpenAI가 G7에 제안한 청소년 AI 안전망

"18세 미만은 더 엄격하게" OpenAI가 G7에 제안한 청소년 AI 안전망

AI가 교육과 학습의 필수 도구가 되면서 청소년의 안전한 사용 환경 조성이 시급해졌다. OpenAI는 G7 정상회의를 통해 글로벌 기준을 정립할 '국제 청소년 AI 안전 기구' 설립을 제안한다. 연령 예측 시스템과 강화된 가드레일을 통해 18세 미만

단순 저장소는 끝났다 — AI 시대의 데이터베이스 도구 10선

단순 저장소는 끝났다 — AI 시대의 데이터베이스 도구 10선

데이터베이스가 단순한 기록 저장소를 넘어 실시간 분석과 AI 메모리 역할로 진화하고 있다. ClickHouse부터 OpenViking까지, 목적별로 특화된 10가지 오픈소스 도구가 공개됐다. 서비스 규모와 목적에 맞는 DB 스택을 선택해 쿼리 속도와

전문성 키우다 바보 되는 AI 막는다, 아마존 노바 포지의 최적화 기술

전문성 키우다 바보 되는 AI 막는다, 아마존 노바 포지의 최적화 기술

기업 전용 데이터로 LLM을 학습시키면 기존의 추론 능력이 망가지는 경우가 많다. 아마존 노바 포지(Amazon Nova Forge)는 데이터 믹싱과 체크포인트 선택으로 이 문제를 해결한다. CPT, SFT, RFT로 이어지는 3단계 파이프라인을 통해

토큰 비용 10배 절감 — 엔비디아·MS, 윈도우부터 클라우드까지 에이전트 풀스택 공개

토큰 비용 10배 절감 — 엔비디아·MS, 윈도우부터 클라우드까지 에이전트 풀스택 공개

AI 에이전트의 실질적 구현은 모델 성능을 넘어 하드웨어와 런타임의 통합 최적화에 달려 있다. 엔비디아와 MS는 윈도우 PC, 애저 클라우드, 로컬 환경을 아우르는 에이전트 전용 통합 스택을 구축했다. 베라 루빈 플랫폼과 GB300 칩셋을 통해 추론