top of page
Discover how we work, grow, and innovate at AIEEV—straight from our team’s perspective.


내 GPU 95%가 놀고 있습니다
GPU를 사놓고 5%만 씁니다 2026년 4월, 기업 Kubernetes 클러스터의 평균 GPU 활용률이 5~30%에 머문다는 데이터가 나왔습니다. 시간당 $2 ~ $15(저가형 GPU와 고성능 GPU 평균치)를 소비하는 GPU가 대부분의 시간 동안 아무것도 하지 않고 있습니다. Cast AI 보고서는 사실 더 직접적입니다. 이 보고서에 따르면, 기업들은 실제 필요한 GPU 비용보다 평균 20배를 더 지출하고 있습니다. AI 경쟁에서 밀리지 않으려고 확보한 자원이 확보한 것만으로 비용이 쌓이고 있습니다. Kubernetes 클러스터 자원 활용률 현황 (출처: CAST AI) 그렇다면 왜 GPU는 놀고 있을까? 문제는 기술이 아니라 구조입니다. Kubernetes는 기본적으로 GPU를 분할 없이 할당합니다. 어떤 팀이 GPU를 예약하면, 그 팀이 쓰든 안쓰든 다른 팀은 접근할 수 없습니다. 모델 학습은 하루에 몇 시간이지만 GPU는 24시간 점유됩니
4월 28일


Air Cloud 가격 비교 총정리: Air API부터 Air Container까지
AI를 잘 활용한다는 것은, 누구나 필요할 때 원하는 만큼 AI를 사용할 수 있는 인프라에서 출발합니다. AI에 대한 관심이 높아지는 만큼, 이를 뒷받침하는 인프라 시장 역시 폭발적인 성장을 지속하고 있습니다. 글로벌 시장에서는 다양한 플레이어들이 각자의 방식으로 인프라 경쟁을 하고 있고 AIEEV도 그 흐름 속에 있습니다. 다만 저희는 기존의 중앙화된 데이터센터 중심 모델에서 벗어나 유휴 자원을 연결하는 분산 클라우드로 시장에 뛰어들었습니다. 오늘은 이 구조가 실제로 어느 정도의 비용 절감을 만들어내는지 주요 공급사들과의 가격 비교를 통해 살펴보겠습니다. Part 1: Air API 가격 비교 몇 달 전, 사용자의 명령만으로 컴퓨터에서 실제 작업까지 수행하는 AI 에이전트 'OpenClaw'가 등장했습니다. 이후 Hermes와 같은 새로운 AI 에이전트가 시장에 등장했고 Claude Code와 Codex는 기능을 빠르게 고도화하면서, 이른바 '잠
4월 24일


AI 인프라 양극화 시대, 대기업은 $29조를 씁니다
설명을 돕기 위해 AI로 생성된 그림입니다. 몇일 전 Meta가 CoreWeave와 $210억 규모의 AI 클라우드 계약을 2032년까지 연장했습니다. 기존 $142억 계약까지 합산하면 총 $350억이 넘습니다. 한화로 약 50조원입니다. CoreWeave는 이 계약을 발표한 시점 기준으로, 역대 가장 빠르게 $50억 ARR을 돌파한 클라우드 기업이 되었습니다. 숫자 자체보다 중요한 건 이 계약의 구조입니다. 쓸지 안 쓸지 모르는 GPU 용량을 몇 년 단위로 미리 확보하는 방식인 장기 용량 예약 모델은 대형 테크 기업들이 AI 인프라를 선점하기 위해 선택하는 대표적인 전략입니다. 🤔 왜 대형 테크 기업들은 장기 계약을 선택할까요? AI 인프라 경쟁에서 GPU 확보는 제품 출시 속도와 직결됩니다. 필요할 때 수급할 수 있는 시장이 아닙니다. NVIDIA Blackwell 시리즈처럼 수요가 폭발하면, 수급 타이밍을 놓친 기업은 수개월을 기다려야 합
4월 15일


AI 인프라, 이제 지리를 초월해야 합니다
전쟁과 지정학적 갈등 속에서 드러난 AI 인프라의 구조적 한계.
중앙 집중형 데이터센터의 취약성을 짚고, 분산형 인프라가 왜 새로운 기준이 되어야 하는지 살펴봅니다.
4월 6일


구글이 발표한 TurboQuant — "비싼 GPU 없이 LLM을 서빙하는 시대"가 가까워지고 있다
80GB GPU는 정말 필수였을까? TurboQuant가 KV 캐시를 압축하면서 LLM 추론 비용 구조가 바뀌고 있습니다.
3월 30일


유휴 GPU 연결해 AI 인프라 비용 절감, 분산 클라우드 전문 스타트업 에이아이브의 도전
유휴 GPU 연결해 AI 인프라 비용 절감, 분산 클라우드 전문 스타트업 에이아이브의 도전
2025년 11월 23일








EP2. 기획자에게 PRD란 무엇일까? : Air Cloud의 PRD를 공유해드립니다.
기획자에게 PRD란 무엇일까? : Air Cloud의 PRD를 공유해드립니다.
2025년 7월 7일


EP1. Air Cloud는 어떻게 탄생했을까?
안녕하세요! AIEEV의 비즈니스 팀에서 서비스기획자로 열심히 성장 중인 윤아 입니다. 🐥 이번 글에는 저희 Air Cloud 의 기획 과정을 중심으로, 어떤 고민 끝에 이 서비스가 세상에 나오게 되었는지를 이야기해보려고 합니다. 이 글이 AI 모델을 구성/활용하는 많은 개발자들과 고객 User flow를 기획하는 기획자들에게 공감과 작은 도움이 되기를 바라며 Air Cloud 의 탄생과 서비스화 과정을 지금부터 풀어보겠습니다 : ) 1. Air Cloud, 어떻게 시작했나요? 우리가 흔히 알고 있는 클라우드 서비스인 AWS나 Google Cloud는 중앙집중형 클라우드인데요, 이런 구조는 비용, 확장성, 자원 효율성 측면에서 한계가 존재합니다. Air Cloud는 이러한 문제에서 시작한 ‘분산형 클라우드 서비스’ 입니다. Air Cloud에서는 Air container 기능을 활용해 누구나 자신의 AI 모델이나 애플리케이션을 쉽게 클라우드에 올
2025년 6월 30일


Wrapping Up CES 2025
At CES, we created a private Air Cloud on-site and delivered a live demo, highlighting the cost-effectiveness and reliability of our distributed GPU cloud solution to a global audience. Despite the challenges of setting up a private Air Cloud due to internet limitations, we were excited to connect with potential customers face-to-face. The showcase provided us with valuable feedback and opened up exciting business opportunities. With our successful closed beta completed with
2025년 5월 29일
bottom of page
