데이터의 가치를 잇다, 컴팩트 하이브리드 RAG
“헤:아림”

"헤:아림"은 일반적인 컴퓨팅 환경에서 구현 가능한 가장 현실적이고 강력한 RAG 솔루션입니다. 당신의 데이터를 더 정확하고 유용하게 활용할 수 있도록 지원하고 막대한 인프라 투자 부담 없이, 현재 보유한 환경에서 즉시 도입 가능한 최적의 RAG 시스템을 제공합니다.

기존 RAG 시스템의 한계

Hallucination(환각)의 원인은 LLM 모델 자체가 아닌, "정확한 문서 검색의 실패"에 있습니다

검색실패의 사각지대

기존의 RAG 시스템은 데이터 간의 관계를 놓치는 키워드 방식과 세부 디테일에 약한 벡터 방식 중 하나에만 의존하면서 검색의 사각지대가 발생합니다. 관련 문서를 전혀 찾지 못할 경우 LLM은 "모른다"고 답하기보다는 자신이 학습한 배경지식을 동원해 답변을 지어내기 시작하며 , 이 과정에서 정보의 왜곡과 환각 현상이 발생하여 시스템의 신뢰도를 떨어뜨리는 주요 원인이 됩니다.

코드성 정보 인식의 한계

일반적인 임베딩 모델은 법 조항 번호, 오류 코드, 테이블 명과 같은 구체적인 문자열을 독립적인 의미 개념으로 완벽하게 분류하지 못하는 기술적 한계가 있습니다. 이로 인해 실제 근거 본문 대신 단순히 유사한 의미를 가진 포괄적 문서를 검색 결과로 가져오게 되며 , 결과적으로 사용자에게 정확한 데이터가 아닌 사실처럼 포장된 잘못된 정보를 제공하게 됩니다.

키워드와 맥락의 완벽한 조화, Hybrid Search

"헤:아림"은 두 가지 검색 방식의 장점만을 결합하여 오답 없는 답변의 근거를 탐색합니다.

고도화된 키워드(Keyword) 검색

사용자가 던진 질문에서 고유 명사나 수치와 같은 핵심 키워드를 정확하게 포착하기 위해 전문적인 형태소 분석 엔진을 활용합니다. 질문 문장을 형태소 단위로 쪼개어 명사와 객체를 정밀하게 추출하고, 이를 기반으로 키워드 매칭을 수행함으로써 벡터 검색이 놓치기 쉬운 세밀한 코드 번호나 고유 명칭까지 단 하나도 놓치지 않고 검색 결과에 반영합니다.

문맥 중심 벡터(Vector) 검색

단순한 단어 일치를 넘어 사용자의 질문 속에 담긴 의도와 전체적인 맥락을 파악하기 위해 다국어 지원 임베딩 모델을 통한 고도의 벡터화 작업을 수행합니다. 이를 통해 의미적으로 가장 유사도가 높은 문서들을 탐색하고 우선순위를 부여함으로써, 자연어 질문에 최적화된 풍부한 답변의 근거 데이터를 확보하여 더욱 지능적이고 유연한 검색 결과를 제공합니다.

가중 RRF 알고리즘 리랭킹

키워드 검색의 정밀함과 벡터 검색의 문맥 파악 능력을 하나로 결합하기 위해 가중치가 적용된 RRF 알고리즘을 사용하여 두 검색 결과를 합산합니다. 이렇게 정제된 최적의 검색 데이터를 LLM 모델에 주입함으로써, 개별 검색 방식의 한계를 극복하고 오답 없는 정확한 근거에 기반한 최상의 답변을 사용자에게 생성하여 전달합니다.

운영 부담을 덜어낸 Compact Architecture

복잡한 외부 서비스 및 모델 사용을 최소화하고 운영 서버 내 핵심 기능을 통합했습니다.

Native 통합 운영

Embedder, POS Tagger, Vector 저장소 등 핵심 모듈을 Docker Container로 단일 서버 내에서 운영합니다. 별도의 대규모 인프라 없이도 RAG를 구성하는 필수 기능들을 효율적으로 운영할 수 있는 현실적인 구조를 제공합니다.

표준 스택 활용

PostgreSQL의 pgvector 확장 기능을 사용하여 개발자들에게 가장 익숙한 SQL 사용 환경에서 벡터 검색을 수행합니다. 복잡한 전담 모델 관리 인력 없이도 기존 인프라 지식을 활용하여 시스템을 안정적으로 운영하고 유지보수 할 수 있습니다.

유연한 LLM 서빙

GPT, Solar, Qwen 과 같은 LLM 서비스와 연동하여 사용자의 목적에 부합하는 답변을 생성합니다. "헤:아림" RAG 시스템은 Open AI Endpoint와 호환되는 Endpoint 를 제공함으로 다양한 서비스와의 연동 편의성을 극대화 하였습니다.

비즈니스 가치를 높이는 "헤:아림"의 차별점

기술적 허들을 낮추고 효율성은 극대화했습니다.

인프라 자원 최적화

전용 Vector Database가 아닌 PostgreSQL 기반의 익숙한 RDB 환경에서 키워드와 벡터 검색을 모두 지원합니다.

데이터 정합성

다중 DB 운영으로 인한 동기화 지연 없이 'Single-Source Truth'로 실시간 정합성을 보장합니다.

운영관리

파편화된 모델 관리 인력 없이 SQL 기반 관리로 운영 복잡도를 획기적으로 낮췄습니다.

법령 Pre-filled RAG 서비스

당사에서는 "헤:아림" 시스템의 실무적 가치를 증명하기 위해 활용도가 높은 대한민국 법령 데이터를 RAG 시스템으로 구축하여 서비스하고 있습니다. 헌법, 법률, 시행령, 시행규칙을 아우르는 총 5,557개의 방대한 법령 데이터를 체계적으로 수집하였으며, 이를 다시 202,398개의 세부 조항으로 분리하여 정밀한 임베딩 작업을 완료하였습니다. 이러한 계층적 데이터 구조 최적화를 통해 복잡한 법률 질문에도 정확한 근거를 찾아 답변할 수 있는 환경을 구현하였으며, 별도의 구축 과정 없이도 누구나 시스템의 성능을 즉시 확인할 수 있도록 무료 체험 서비스를 제공하고 있습니다.

서비스 사용계정
사용자 계정 (이메일) : contact@flexoptimum.com
비밀번호 : contact

"헤:아림" 법령 Pre-filled RAG 서비스 사용하기

Company

주식회사 플렉스옵티멈
대표이사 : 박상국
사업자등록번호 : 642-81-03057

Address

06621 서울특별시 서초구 강남대로53길 8, 7층 214호

E-Mail

contact@flexoptimum.com
본 이메일은 계정은 고객의 문의가 들어오면 당사 에이전트에 의해서 분석후 답변을 드리고 있습니다.

Service Site

agnet.flexoptimum.com
당사에서 제공하고 있는 다양한 에이전트 서비스 URL 입니다.

데이터의 가치를 잇다, 컴팩트 하이브리드 RAG“헤:아림”