기술
Ollama로 로컬 LLM 서빙 — deepseek-r1 14B를 실제 프로덕션에 쓰는 법
3-tier fallback(Oracle→Old Mac→New Mac) 구조로 Ollama를 프로덕션에서 운영하는 실제 구성. nomic-embed-text 임베딩과 HTTP 11434 포트 운영 팁.
#Ollama#LLM#deepseek#임베딩#Fallback
블로그 태그
#Ollama 태그가 붙은 GRAXEL 글 3개를 모았습니다. 관련 주제를 이어서 살펴보세요.
3-tier fallback(Oracle→Old Mac→New Mac) 구조로 Ollama를 프로덕션에서 운영하는 실제 구성. nomic-embed-text 임베딩과 HTTP 11434 포트 운영 팁.
4 OCPU, 24GB RAM, 200GB 디스크를 영구 무료로 받아 pgvector PostgreSQL 17 + Rust Axum API + Ollama를 Cloudflare Tunnel로 서빙한 기록.
pgvector 하이브리드 검색과 Ollama 임베딩으로 11,600개 정부 혜택 정책을 검색하는 내혜택 서비스의 실제 운영 경험을 공유합니다.