top of page


AI 인프라 양극화 시대, 대기업은 $29조를 씁니다
설명을 돕기 위해 AI로 생성된 그림입니다. 몇일 전 Meta가 CoreWeave와 $210억 규모의 AI 클라우드 계약을 2032년까지 연장했습니다. 기존 $142억 계약까지 합산하면 총 $350억이 넘습니다. 한화로 약 50조원입니다. CoreWeave는 이 계약을 발표한 시점 기준으로, 역대 가장 빠르게 $50억 ARR을 돌파한 클라우드 기업이 되었습니다. 숫자 자체보다 중요한 건 이 계약의 구조입니다. 쓸지 안 쓸지 모르는 GPU 용량을 몇 년 단위로 미리 확보하는 방식인 장기 용량 예약 모델은 대형 테크 기업들이 AI 인프라를 선점하기 위해 선택하는 대표적인 전략입니다. 🤔 왜 대형 테크 기업들은 장기 계약을 선택할까요? AI 인프라 경쟁에서 GPU 확보는 제품 출시 속도와 직결됩니다. 필요할 때 수급할 수 있는 시장이 아닙니다. NVIDIA Blackwell 시리즈처럼 수요가 폭발하면, 수급 타이밍을 놓친 기업은 수개월을 기다려야 합
4월 15일


월 몇 토큰부터 GPU를 직접 빌리는 게 더 저렴할까?
AI 서비스를 계속 운영하다 보면 언젠가 이런 궁금증에 마주하게 됩니다. "지금 우리가 API로 쓰는 게 진짜 저렴한 걸까? 아니면 그냥 GPU를 사서 직접 돌리는 게 낫지 않을까?" 모델 성능이 평준화되면서 이제 승부처는 비용이 되었습니다. 팀마다 자신의 사용량 규모에서 어느 방식이 진짜 저렴한지 계산하기 시작했고, 답은 사용량에 따라 명확히 달라집니다. 이 글에서는 AI 인프라 도입을 고민하는 팀들을 위해 세 가지 선택지의 실제 비용 구조를 숫자로 비교합니다. 세 가지 인프라 운영 방식과 비용 구조 비용을 비교하기 전에, 먼저 각 선택지의 비용 구조를 이해해야 합니다. 같아 보이는 비용도 어떤 방식으로 발생하느냐에 따라, 사용량 규모별로 유불리가 완전히 달라지기 때문입니다. 1. 서버리스 API: 쓴 만큼만 낸다 (고정비 X + 토큰당 과금) | 비용 구조 : 고정비 없음 + 토큰당 과금 토큰 단위로 사용료를 내는 방식입니다. GPU를 직접
4월 14일


가장 저렴하게 Qwen을 쓰는 방법
요즘 산업, 직무, 학계 너나할 것 없이 "나만의 AI 에이전트 비서"를 만들고 업무에 적용하고 있습니다. 그런데 막상 계속 쓰다 보면 피할 수 없는 현실과 마주하게 됩니다. 바로 비용 입니다. 월 구독료보다 비싼, 나도 모르게 쌓인 API 호출 비용이 청구서로 날아오죠. AI 에이전트는 작업 한 번에 모델을 적게는 수십에서 많게는 수백 번 호출합니다. 스스로 계획을 세우고-도구를 쓰고-결과를 검증하고-다시 호출하는 루프가 반복되기 때문이죠. 에이전트가 똑똑해질수록 API 비용이 함께 올라가는 건 어쩌면 당연한 수순입니다. 그런데 이렇게 매일 쌓이는 API 비용이 과연 지속가능할까요? 쓸수록 적자가 나는 구조라면 아무리 좋은 AI도 프로덕트에 넣기는 어렵습니다. 에이전틱 AI 시대에 우리에게 진짜 필요한 건 더 좋은 모델이 아니라, 더 저렴한 추론입니다. Air API는 바로 이 문제를 풀기 위해 만들어졌습니다. 오픈소스 모델, 에이전트 시대의
4월 10일


AI 인프라, 이제 지리를 초월해야 합니다
전쟁과 지정학적 갈등 속에서 드러난 AI 인프라의 구조적 한계.
중앙 집중형 데이터센터의 취약성을 짚고, 분산형 인프라가 왜 새로운 기준이 되어야 하는지 살펴봅니다.
4월 6일
bottom of page
