블로그

AIEEV Blog

에이아이브의 최신 소식을 확인하세요

All Posts
Newsroom
Product
Inside AIEEV
Customer Stories
Engineering

AI 구독료는 아직 커피 한 잔입니다. 그런데 에이전트 시대에도 그럴까요?

월 20달러. 지금 AI 구독료는 한국 기준으로 대략 치킨 한 마리, 미국 기준으로는 스타벅스 커피 몇 잔 정도로 느껴집니다. BZCF의 한 글에서는 ChatGPT Plus나 Claude Pro 같은 월 $20 구독료가 미국·싱가포르·독일에서는 월급 대비 약 0.5%, 한국에서는 약 0.75% 수준이지만, 일부 개발도상국에서는 7~20%까지 체감될 수 있다고 비교했습니다. 같은 $20라도 어떤 나라에서는 생산성 도구이고, 어떤 나라에서는 부담스러운 고정비가 됩니다. 그런데 더 중요한 질문은 따로 있습니다. 이 가격이 앞으로도 월 $20에 머물 수 있을까요? 지금 우리가 내는 AI 구독료는 대부분 “대화형 AI” 기준입니다. 사람이 질문하고, 모델이 답하고, 다시 사람이 이어서 묻는 구조입니다. 하지만 AI가 점점 에이전트로 바뀌고 있습니다. 이제 AI는 답변만 하지 않습니다. 계획을 세우고, 검색하고, 파일을 읽고, 코드를 실행하고, 도구를 호출하

Inside AIEEV

5월 22일

AI 모델 배포 비용을 낮추는 두 가지 기술: Quantization과 Prefix Caching

안녕하세요. AIEEV Dev Team의 김진범입니다. 저는 학부와 대학원에서 컴퓨터공학을 전공하고 AIEEV 창업 초기부터 함께하며 Air Cloud에 더 많은 분산 자원이 효율적으로 운영될 수 있도록 기여하고 있습니다 연구생 시절에는 AI 서비스의 성능 향상을 위한 이론적 연구와 실험을 많이 진행했습니다. 하지만 실제 서비스를 운영하다 보니, 좋은 모델과 높은 성능만으로는 충분하지 않다는 것을 알게 되었으며, 중요한 것은 AI 서비스를 사용자가 실제로 사용할 수 있을 만큼 빠르고, 비용 측면에서도 지속 가능하며, 안정적으로 제공할 수 있느냐였습니다. 저희 팀도 분산 GPU 환경에서 서비스를 운영하며 이 문제를 계속 마주해왔습니다. 더 큰 모델을 안정적으로 배포하고, 더 많은 요청을 처리하면서도 응답 지연시간을 일정하게 유지하려면 추론 단계의 최적화가 필요합니다. 모델 크기가 커질수록 GPU 메모리 사용량은 자연스럽게 증가합니다. 여기에 긴 시스

Engineering

5월 7일

월 몇 토큰부터 GPU를 직접 빌리는 게 더 저렴할까?

AI 서비스를 계속 운영하다 보면 언젠가 이런 궁금증에 마주하게 됩니다. "지금 우리가 API로 쓰는 게 진짜 저렴한 걸까? 아니면 그냥 GPU를 사서 직접 돌리는 게 낫지 않을까?" 모델 성능이 평준화되면서 이제 승부처는 비용이 되었습니다. 팀마다 자신의 사용량 규모에서 어느 방식이 진짜 저렴한지 계산하기 시작했고, 답은 사용량에 따라 명확히 달라집니다. 이 글에서는 AI 인프라 도입을 고민하는 팀들을 위해 세 가지 선택지의 실제 비용 구조를 숫자로 비교합니다. 세 가지 인프라 운영 방식과 비용 구조 비용을 비교하기 전에, 먼저 각 선택지의 비용 구조를 이해해야 합니다. 같아 보이는 비용도 어떤 방식으로 발생하느냐에 따라, 사용량 규모별로 유불리가 완전히 달라지기 때문입니다. 1. 서버리스 API: 쓴 만큼만 낸다 (고정비 X + 토큰당 과금) | 비용 구조 : 고정비 없음 + 토큰당 과금 토큰 단위로 사용료를 내는 방식입니다. GPU를 직접

Product

4월 14일

Air API가 출시되었습니다

오픈소스 AI 모델을 직접 서빙하려면, 모델 선택보다 인프라 세팅에 더 많은 시간이 걸립니다. GPU 확보하고, 환경 구성하고, 트래픽에 맞춰 스케일링까지 — 모델 하나 돌리기까지의 과정이 너무 깁니다. 저희 팀이 이 문제를 해결합니다! 오픈소스 AI 모델을 서버리스 API로 제공하는 서비스인 Air API를 드디어 출시하게 되었는데요, 인프라 구축 없이 API 키 하나로 바로 시작할 수 있으니까 지금 바로 테스트해보세요. 주요 특징 💡 OpenAI 호환 엔드포인트 기존에 OpenAI API를 사용하고 계셨다면, 엔드포인트 URL만 바꾸면 됩니다. 코드 수정이 거의 필요 없습니다. 💡 토큰 기반 종량제 월 고정 요금이 아닙니다. 사용한 토큰만큼만 과금됩니다. 💡 인프라 관리 불필요 GPU 확보, 모델 배포, 스케일링을 AIEEV의 분산 GPU 인프라가 처리합니다. 출시 모델 Air API는 Qwen 시리즈 3종부터 시작합니다. 앞으로 점

Product

4월 9일

유휴 GPU 연결해 AI 인프라 비용 절감, 분산 클라우드 전문 스타트업 에이아이브의 도전

Inside AIEEV

2025년 11월 23일

에이아이브, SK AI 서밋 2025서 분산형 GPU 인프라 공개

에이아이브 (대표 박세진)가 비용 절감과 확장성을 갖춘 차세대 인공지능(AI) 인프라 모델을 제시했다. 에이아이브는 서울 코엑스에서 열린 SK AI 서밋 2025에 참가해 그래픽처리장치(GPU) 클라우드 에어클라우드를 소개했다고 12일 밝혔다. '오늘의 혁신, 내일의 도약'을 주제로 열린 이번 행사는 최태원 SK그룹 회장을 비롯해 엔비디아, 앤트로픽, 카카오 등 글로벌 AI 생태계를 이끄는 주요 인사와 기업들이 참석해 인공지능 기술의 발전 방향을 논의했다. 에이아이브는 SK텔레콤 AI 스타트업 엑셀러레이팅 프로그램 선정 기업으로, 스타트업 존에서 에어클라우드의 GPU 자동 확장 기능을 시연했다. 에어클라우드는 전 세계 개인과 기업의 유휴 GPU를 연결해 대규모 데이터센터에 대한 의존도를 낮추고, 저비용·고효율의 인공지능 추론을 실현하는 분산형 클라우드 플랫폼이다. 이를 통해 인공지능 추론 비용을 최대 80% 절감하면서도 대규모 연산을 안정적으로

Newsroom

2025년 11월 12일

AIEEV 게시물 25개
AIRCLOUD 게시물 23개
AICOMPUTING 게시물 12개
에이아이브 게시물 10개
AIcloud 게시물 9개
클라우드비용비교 게시물 9개
GPUCLOUD 게시물 8개
AI 게시물 6개
AIRCLOUD+ 게시물 6개
Air API 게시물 6개
AITrend 게시물 5개
aieev 게시물 5개
gpucloud 게시물 5개
AI인프라 게시물 4개
Air Cloud 게시물 4개
에어클라우드 게시물 4개
distributedaicloud 게시물 3개
클라우드가격비교 게시물 3개
Business 게시물 2개
CloudComputing 게시물 2개
aircloud 게시물 2개
brand 게시물 2개
brandguide 게시물 2개
branding 게시물 2개
cloud 게시물 2개
container 게시물 2개
cxguide 게시물 2개
skt 게시물 2개
sktsummit 게시물 2개
tech 게시물 2개
분산형GPU클라우드 게시물 2개
분산형ai클라우드 게시물 2개
서비스기획 게시물 2개
프로모션 게시물 2개
AI Cost 게시물 1개
AX플랫폼구축 게시물 1개
FundingAnnouncement 게시물 1개
Google 게시물 1개
PreA 게시물 1개
Updates 게시물 1개
agent 게시물 1개
aiinference 게시물 1개
aisummit 게시물 1개
claude 게시물 1개
fix 게시물 1개
fix2025 게시물 1개
gmep 게시물 1개
lguplus 게시물 1개
microdips 게시물 1개
plugandplay 게시물 1개
prd 게시물 1개
shift 게시물 1개
경남매일 게시물 1개
디엑스웍스 게시물 1개
마이크로딥스 게시물 1개
박세진대표 게시물 1개
산업대상 게시물 1개
스타트업대상 게시물 1개
시프트 게시물 1개
에어클라우드정식출시 게시물 1개
엘지유플러스 게시물 1개
중기부글로벌엑셀러레이팅 게시물 1개
클라우드바우처 게시물 1개
플러그앤플레이 게시물 1개
할인 게시물 1개
확장가능한클라우드 게시물 1개