top of page
Aieev
게시물 작성자
더보기
프로필
가입일: 2025년 7월 7일
게시물 (32)
2026년 4월 28일 ∙ 2 분
내 GPU 95%가 놀고 있습니다
GPU를 사놓고 5%만 씁니다 2026년 4월, 기업 Kubernetes 클러스터의 평균 GPU 활용률이 5~30%에 머문다는 데이터가 나왔습니다. 시간당 $2 ~ $15(저가형 GPU와 고성능 GPU 평균치)를 소비하는 GPU가 대부분의 시간 동안 아무것도 하지 않고 있습니다. Cast AI 보고서는 사실 더 직접적입니다. 이 보고서에 따르면, 기업들은 실제 필요한 GPU 비용보다 평균 20배를 더 지출하고 있습니다. AI 경쟁에서 밀리지 않으려고 확보한 자원이 확보한 것만으로 비용이 쌓이고 있습니다. Kubernetes 클러스터 자원 활용률 현황 (출처: CAST AI) 그렇다면 왜 GPU는 놀고 있을까? 문제는 기술이 아니라 구조입니다. Kubernetes는 기본적으로 GPU를 분할 없이 할당합니다. 어떤 팀이 GPU를 예약하면, 그 팀이 쓰든 안쓰든 다른 팀은 접근할 수 없습니다. 모델 학습은 하루에 몇 시간이지만 GPU는 24시간 점유됩니다. 팀마다 최악의 상황을...
4
0
2026년 4월 24일 ∙ 4 분
Air Cloud 가격 비교 총정리: Air API부터 Air Container까지
AI를 잘 활용한다는 것은, 누구나 필요할 때 원하는 만큼 AI를 사용할 수 있는 인프라에서 출발합니다. AI에 대한 관심이 높아지는 만큼, 이를 뒷받침하는 인프라 시장 역시 폭발적인 성장을 지속하고 있습니다. 글로벌 시장에서는 다양한 플레이어들이 각자의 방식으로 인프라 경쟁을 하고 있고 AIEEV도 그 흐름 속에 있습니다. 다만 저희는 기존의 중앙화된 데이터센터 중심 모델에서 벗어나 유휴 자원을 연결하는 분산 클라우드로 시장에 뛰어들었습니다. 오늘은 이 구조가 실제로 어느 정도의 비용 절감을 만들어내는지 주요 공급사들과의 가격 비교를 통해 살펴보겠습니다. Part 1: Air API 가격 비교 몇 달 전, 사용자의 명령만으로 컴퓨터에서 실제 작업까지 수행하는 AI 에이전트 'OpenClaw'가 등장했습니다. 이후 Hermes와 같은 새로운 AI 에이전트가 시장에 등장했고 Claude Code와 Codex는 기능을 빠르게 고도화하면서, 이른바 '잠잘 때도 일하기', 'AI 직원...
22
0
2026년 4월 16일 ∙ 5 분
명령어 하나로 끝내는 Air API 연동: ClawHub 플러그인 이야기
안녕하세요, 개발팀에서 DevOps/SRE를 담당하고 있는 이창윤입니다. 최근 Air API 출시와 함께 저희 팀은 인프라 모니터링 체계를 구축하고 있습니다. 이번 글에서는 그 과정에서 개발한 OpenClaw 플러그인을 소개하려고 합니다 🙂 시작하기 전에 OpenClaw를 한동안 써본 분이라면 한 번쯤 이런 상황을 겪어보셨을 겁니다. 외부 모델 프로바이더를 연결하려는 순간, 설정 메뉴를 뒤적이고 Base URL을 복사-붙여넣기 하고 사용할 모델마다 엔드포인트를 손으로 하나씩 등록하는 그 과정을요. 하다보면 동작은 하는데, 세팅이 유쾌하지는 않습니다. 이 글에서는 저희 팀이 개발한 플러그인을 통해 plugins install 명령어 하나가 이 모든 반복을 어떻게 없애는지를 소개해보도록 하겠습니다. 그리고 그 뒤에서는 실제로 무슨 코드가 돌아가는지까지도 함께 들여다보겠습니다. 기존 방식: Custom Provider, 모델마다 반복 아래 그림처럼, 기존에는 OpenClaw와...
11
0
bottom of page
