DB IT用語 韓国語一覧
DB IT 용어 일본어 목록
150語収録 / 150개 수록
第2正規形を満たしつつ、非キー属性間の推移的関数従属を排除したDB設計の正規化形式。データの冗長性をさらに削減できる。
제2정규형을 만족하면서 비키 속성 간의 이행적 함수 종속을 제거한 DB 설계 정규화 형식으로, 데이터 중복성을 더욱 줄일 수 있다.
データをリアルタイムで継続的に処理・格納するDBシステム。Apache KafkaやFlink連携で、センサーデータやログの即時分析に活用される。
데이터를 실시간으로 지속적으로 처리·저장하는 DB 시스템. Apache Kafka나 Flink와 연계하여 센서 데이터나 로그의 즉시 분석에 활용된다.
サーバー不要で動作する軽量な組み込みRDBMS。単一ファイルにデータを格納し、モバイルアプリやローカル環境での開発・テストに広く利用される。
서버 없이 동작하는 경량 임베디드 RDBMS. 단일 파일에 데이터를 저장하며, 모바일 앱이나 로컬 환경의 개발·테스트에 널리 활용된다.
データパイプライン全体の健全性・品質・鮮度を継続的に監視する能力。データの鮮度・分布・量・スキーマ・系譜の5つのピラーで評価されることが多い。
데이터 파이프라인 전체의 건전성·품질·신선도를 지속적으로 모니터링하는 능력. 데이터의 신선도·분포·양·스키마·계보의 5가지 기둥으로 평가되는 경우가 많다.
テーブルの一部の行にのみ作成されるインデックス。WHERE句で条件を指定し、特定条件を満たす行だけをインデックス化することでサイズを削減し検索を高速化する。
테이블의 일부 행에만 생성되는 인덱스. WHERE 조건을 지정해 특정 조건을 만족하는 행만 인덱싱함으로써 크기를 줄이고 검색 성능을 향상시킨다.
Online Analytical Processingの略。大量データを多次元的に分析するための処理方式で、経営分析やBIツールの基盤として活用される。
Online Analytical Processing의 약자. 대용량 데이터를 다차원적으로 분석하기 위한 처리 방식으로, 경영 분석 및 BI 도구의 기반으로 활용된다.
データベースがクエリの実行計画を最適化するために保持するインデックスの使用状況や分布情報。定期的な更新がパフォーマンス維持に重要。
데이터베이스가 쿼리 실행 계획을 최적화하기 위해 보유하는 인덱스 사용 현황 및 분포 정보. 정기적인 업데이트가 성능 유지에 중요함.
表の「列」。
표의 "열".
SQL文の中に入れ子で記述される別のSELECT文のこと。WHERE句やFROM句、SELECT句に埋め込み、外側のクエリに動的な条件や値を提供するために使用される。
SQL문 안에 중첩으로 작성되는 또 다른 SELECT문. WHERE절, FROM절, SELECT절에 삽입하여 외부 쿼리에 동적인 조건이나 값을 제공하기 위해 사용된다.
2つ以上のテーブルを結合する際、両テーブルに一致するレコードのみを返すSQL結合方式。JOINまたはINNER JOINと記述し、最も基本的な結合操作として広く使用される。
2개 이상의 테이블을 결합할 때 양쪽 테이블에 일치하는 레코드만 반환하는 SQL 조인 방식. JOIN 또는 INNER JOIN으로 작성하며, 가장 기본적인 조인 방식으로 널리 사용된다.
複数のトランザクションやスレッドが互いにリソースのロック解放を待ち続け、処理が永久に停止する状態。DBやマルチスレッド環境で発生しやすく、設計段階での対策が重要。
여러 트랜잭션이나 스레드가 서로 상대방의 리소스 잠금 해제를 무한정 기다리며 처리가 영구적으로 멈추는 상태. DB나 멀티스레드 환경에서 자주 발생하며, 설계 단계에서의 대책이 중요하다.
データベースのデータをSQL文やCSVなどの論理的な形式でエクスポートするバックアップ手法。物理バックアップと異なり、異なるDBバージョンや環境への移行にも利用できる。
데이터베이스의 데이터를 SQL문이나 CSV 등 논리적인 형식으로 내보내는 백업 방식. 물리 백업과 달리 다른 DB 버전이나 환경으로의 마이그레이션에도 활용할 수 있다.
データの生産者と消費者の間でスキーマ・品質・SLAを明示的に合意する契約。データパイプラインの信頼性を高め、データ品質問題を上流で防ぐ近年注目のプラクティス。
데이터 생산자와 소비자 사이에서 스키마·품질·SLA를 명시적으로 합의하는 계약. 데이터 파이프라인의 신뢰성을 높이고, 데이터 품질 문제를 상류에서 방지하는 최근 주목받는 관행.
データレイク(非構造化データの大規模蓄積)とデータウェアハウス(構造化分析)の利点を統合したアーキテクチャ。DeltaLakeやApache Icebergが代表的な実装技術。
데이터 레이크(비정형 데이터 대규모 저장)와 데이터 웨어하우스(구조화 분석)의 장점을 통합한 아키텍처. Delta Lake와 Apache Iceberg가 대표적인 구현 기술이다.
組織内でデータが部門ごと・システムごとに孤立して保存されており、他部門からアクセスや連携ができない状態。全社的なデータ活用やDXを阻害する大きな要因となる。
조직 내에서 데이터가 부서별·시스템별로 고립되어 저장되어 있어, 다른 부서에서 접근하거나 연동할 수 없는 상태. 전사적인 데이터 활용이나 DX를 저해하는 큰 요인이 된다.
データベースのトランザクションやシステムの変更を、以前の状態に戻す操作。障害発生時やデプロイ失敗時に安全な状態へ復元するために使用される。
데이터베이스 트랜잭션이나 시스템 변경 사항을 이전 상태로 되돌리는 작업. 장애 발생 시나 배포 실패 시 안전한 상태로 복원하기 위해 사용된다.
WITH RECURSIVEを使い、自己参照するCTE(Common Table Expression)。階層データや木構造のトラバーサルに活用される再帰クエリの手法。
WITH RECURSIVE를 사용하여 자기 자신을 참조하는 CTE(Common Table Expression)로, 계층 데이터나 트리 구조 순회에 활용되는 재귀 쿼리 기법입니다.
文書やテキストデータ全体を対象に、任意のキーワードで検索する技術。ElasticsearchやMySQLのFULLTEXT INDEXなどで実装される。
문서나 텍스트 데이터 전체를 대상으로 임의의 키워드로 검색하는 기술. Elasticsearch나 MySQL의 FULLTEXT INDEX 등으로 구현된다.
複数の異なるデータソース(DB・S3・BigQuery等)にまたがるクエリを単一SQLで実行する機能。BigQuery OmniやAthena Federated QueryなどがSQL一本でのクロスソース分析を実現。
여러 다른 데이터 소스(DB·S3·BigQuery 등)에 걸친 쿼리를 단일 SQL로 실행하는 기능. BigQuery Omni나 Athena Federated Query 등이 SQL 하나로 크로스 소스 분석을 실현한다.
実行に一定時間以上かかったSQLクエリを記録するDBのログ機能。パフォーマンス改善のためのボトルネック特定に活用される。MySQLやPostgreSQLで標準サポート。
일정 시간 이상 소요된 SQL 쿼리를 기록하는 DB 로그 기능입니다. 성능 개선을 위한 병목 구간 파악에 활용되며, MySQL과 PostgreSQL에서 기본 지원됩니다.
BIツールとデータソースの間に置く抽象化レイヤー。メトリクスの定義を一元管理し、異なるBIツールから同じ定義で指標を参照できるようにする。dbt Semantic LayerやCubeが代表例。
BI 툴과 데이터 소스 사이에 두는 추상화 레이어. 메트릭 정의를 일원 관리하여, 다른 BI 툴에서 같은 정의로 지표를 참조할 수 있게 한다. dbt Semantic Layer나 Cube가 대표적인 예.
データベースへの命令文。
데이터베이스에 대한 명령문.
キーと値のペアでデータを管理するNoSQLデータベース。高速な読み書きが特徴で、セッション管理やキャッシュ用途に広く使われる。RedisやDynamoDBが代表例。
키와 값의 쌍으로 데이터를 관리하는 NoSQL 데이터베이스. 빠른 읽기/쓰기가 특징이며, 세션 관리나 캐시 용도로 널리 사용된다. Redis와 DynamoDB가 대표적인 예이다.
JSONやBSONなどのドキュメント形式でデータを保存するNoSQLデータベース。MongoDBやCouchDBが代表例で、スキーマレスな柔軟なデータ管理が可能。
JSON이나 BSON 등의 도큐먼트 형식으로 데이터를 저장하는 NoSQL 데이터베이스. MongoDB, CouchDB가 대표적이며 스키마 없이 유연한 데이터 관리가 가능하다.
DBやネットワーク接続が適切にクローズされず、接続リソースが解放されないまま蓄積される問題。放置するとシステム全体のパフォーマンス低下やサービス停止を引き起こす。
DB나 네트워크 연결이 적절히 종료되지 않아 연결 리소스가 해제되지 않은 채 누적되는 문제. 방치하면 시스템 전체의 성능 저하 및 서비스 중단을 초래할 수 있다.
同一テーブルを複数の別名(エイリアス)で参照し、自分自身とJOINするSQL技法。階層構造や親子関係を持つデータの取得に使われる。
동일한 테이블을 여러 별칭(alias)으로 참조하여 자기 자신과 JOIN하는 SQL 기법. 계층 구조나 부모-자식 관계를 가진 데이터 조회에 활용된다.
データウェアハウスから特定の部門や用途向けに切り出した小規模なデータベース。営業・マーケティングなど部門ごとに最適化され、分析クエリの高速化に貢献する。
데이터 웨어하우스에서 특정 부서나 용도에 맞게 추출한 소규모 데이터베이스. 영업·마케팅 등 부서별로 최적화되어 분석 쿼리 속도 향상에 기여한다.
データベースのデータを複数のノードやサーバに複製する際の方針。同期・非同期レプリケーションや、マスター/スレーブ構成などの選択が含まれる。
데이터베이스 데이터를 여러 노드나 서버에 복제할 때의 방침. 동기·비동기 복제나 마스터/슬레이브 구성 등의 선택이 포함된다.
PostgreSQLで使用されるバイナリ形式のJSONデータ型。通常のJSON型と異なり、データを解析済みのバイナリ形式で保存するため、検索・インデックス作成が高速で柔軟なクエリが可能。
PostgreSQL에서 사용되는 바이너리 형식의 JSON 데이터 타입. 일반 JSON 타입과 달리 데이터를 파싱된 바이너리 형식으로 저장하기 때문에 검색 및 인덱스 생성이 빠르고 유연한 쿼리가 가능하다.
DuckDBをベースにしたサーバーレスのクラウド分析データベース。ローカルのDuckDBとクラウドシームレスに連携し、データ分析を効率化する。
DuckDB 기반의 서버리스 클라우드 분석 데이터베이스. 로컬 DuckDB와 클라우드를 원활하게 연계하여 데이터 분석을 효율화한다.
SQLでデータ変換ロジックを管理するオープンソースツール。Git管理・テスト・ドキュメント自動生成・リネージ可視化に対応し、データエンジニアの生産性を大幅に向上させる。
SQL로 데이터 변환 로직을 관리하는 오픈소스 툴. Git 관리·테스트·문서 자동 생성·리니지 시각화에 대응하며, 데이터 엔지니어의 생산성을 크게 향상시킨다.
データベースのテーブルで各レコードを一意に識別するためのカラム。NULLを許可せず、重複も不可。設計の基本となる重要な制約。
데이터베이스 테이블에서 각 레코드를 고유하게 식별하기 위한 컬럼. NULL을 허용하지 않으며 중복도 불가. 설계의 기본이 되는 중요한 제약 조건.
データウェアハウスの分析済みデータを営業・マーケ・CSなどの業務ツールへ逆方向に連携する手法。CensusやHighTouchが代表的なツールで、データ活用の最後の1マイルを担う。
데이터 웨어하우스의 분석 완료 데이터를 영업·마케팅·CS 등의 업무 툴로 역방향 연계하는 기법. Census나 HighTouch가 대표적인 툴이며, 데이터 활용의 마지막 1마일을 담당한다.
組織内のデータ資産を一元管理するメタデータのリポジトリ。データの所在・定義・オーナー・品質情報を整理し、データの検索性と活用性を高めるための仕組み。
조직 내 데이터 자산을 중앙에서 관리하는 메타데이터 저장소. 데이터의 위치·정의·소유자·품질 정보를 정리하여 데이터 검색성과 활용성을 높이기 위한 체계.
長期保存が必要なデータを低コストのストレージに移行・保管する仕組み。アクセス頻度が低い過去データを分離し、本番DBのパフォーマンス維持とコスト削減を両立させる。
장기 보존이 필요한 데이터를 저비용 스토리지로 이전·보관하는 구조. 접근 빈도가 낮은 과거 데이터를 분리하여 운영 DB의 성능 유지와 비용 절감을 동시에 실현한다.
データベースのデータファイルやログファイルをOSレベルでそのままコピーするバックアップ手法。論理バックアップより高速で、大規模DBの復旧に適している。
데이터베이스의 데이터 파일과 로그 파일을 OS 레벨에서 그대로 복사하는 백업 방식. 논리 백업보다 빠르며 대규모 DB 복구에 적합하다.
アプリケーションとDBの間に位置する中間層。接続プーリング、負荷分散、フェイルオーバーを透過的に処理し、DBへの直接接続数を削減してスケーラビリティを向上させる。
애플리케이션과 DB 사이에 위치하는 중간 계층. 커넥션 풀링, 부하 분산, 페일오버를 투명하게 처리하며, DB 직접 연결 수를 줄여 확장성을 향상시킨다.
SQLにおける共通テーブル式(Common Table Expression)。WITH句を使って一時的な名前付き結果セットを定義し、クエリ内で再利用できる構文。再帰クエリにも対応。
SQL의 공통 테이블 표현식(Common Table Expression). WITH 절을 사용해 임시 이름 있는 결과 집합을 정의하고 쿼리 내에서 재사용할 수 있는 구문. 재귀 쿼리에도 대응 가능.
複数のDBノードが互いにマスターとして機能し、どのノードへの書き込みも他ノードに双方向同期されるレプリケーション構成。可用性向上に有効だが競合解決が課題。
여러 DB 노드가 서로 마스터로 동작하며, 어느 노드에 쓴 데이터도 다른 노드에 양방향으로 동기화되는 복제 구성. 가용성 향상에 효과적이지만 충돌 해결이 과제.
企業内の複数システムから収集したデータを一元管理・分析するための大規模な統合データ保管基盤。BI・意思決定支援に活用される。
기업 내 여러 시스템에서 수집한 데이터를 통합 관리·분석하기 위한 대규모 데이터 저장 인프라. BI 및 의사결정 지원에 활용된다.
複数のデータベースやサービスにまたがるトランザクションを一貫性を保ちながら処理する仕組み。2フェーズコミット(2PC)やSagaパターンが代表的な実装手法。
여러 데이터베이스나 서비스에 걸친 트랜잭션을 일관성을 유지하면서 처리하는 메커니즘. 2단계 커밋(2PC)과 Saga 패턴이 대표적인 구현 방식이다.
Business Intelligenceツール。データを可視化・分析するためのソフトウェア。TableauやPower BIなどが代表例で、経営判断やKPI管理に活用される。
Business Intelligence 툴. 데이터를 시각화·분석하기 위한 소프트웨어. Tableau나 Power BI 등이 대표적이며, 경영 판단이나 KPI 관리에 활용된다.
テーブルの物理的なデータ並び順をインデックスキーに基づいて決定するインデックス。1テーブルに1つのみ作成可能で、主キーに設定されることが多い。検索・範囲スキャンが高速。
테이블의 물리적 데이터 정렬 순서를 인덱스 키를 기준으로 결정하는 인덱스. 테이블당 하나만 생성 가능하며, 주로 기본 키에 설정된다. 검색 및 범위 스캔 속도가 빠르다.
データベースを特定の時点の状態に復元する機能。トランザクションログを活用し、障害発生前や誤操作前の任意の時刻にDBを巻き戻すことが可能。
데이터베이스를 특정 시점의 상태로 복원하는 기능. 트랜잭션 로그를 활용하여 장애 발생 전이나 잘못된 조작 이전의 임의 시각으로 DB를 되돌릴 수 있다.
DB操作言語。
DB 조작 언어.
データベースの構造(テーブル・カラム・リレーション・制約など)を定義・設計する作業。システムの拡張性やパフォーマンスに直結するため、開発初期に慎重に行う必要がある。
데이터베이스의 구조(테이블·컬럼·관계·제약 조건 등)를 정의하고 설계하는 작업. 시스템의 확장성과 성능에 직결되므로 개발 초기에 신중하게 진행해야 한다.
SQLでSELECT文の結果を特定の列を基準に昇順(ASC)または降順(DESC)で並べ替えるための句。複数列の指定も可能で、データの表示順序を制御する。
SQL에서 SELECT 문의 결과를 특정 열을 기준으로 오름차순(ASC) 또는 내림차순(DESC)으로 정렬하는 절. 여러 열 지정도 가능하며, 데이터의 표시 순서를 제어한다.
データベースにおける文字列の比較・並び替えルールを定義する設定。文字コードや言語ごとに大文字小文字の区別、アクセント記号の扱い方などを制御する。
데이터베이스에서 문자열의 비교 및 정렬 규칙을 정의하는 설정. 문자 코드와 언어별로 대소문자 구분, 악센트 기호 처리 방식 등을 제어한다.
ノードとエッジでデータの関係性を表現するDBMS。SNSの友人関係や推薦エンジンなど、複雑な関連データの高速クエリに適しており、Neo4jやAmazon Neptuneが代表例。
노드와 엣지로 데이터 관계를 표현하는 DBMS. SNS 친구 관계나 추천 엔진 등 복잡한 연관 데이터의 고속 쿼리에 적합하며, Neo4j와 Amazon Neptune이 대표적인 예시입니다.
複数のトランザクションやプロセスが互いにロックを待ち合い、処理が永遠に進まない状態(デッドロック)を未然に防ぐための設計・実装手法。
여러 트랜잭션이나 프로세스가 서로 락을 기다리며 처리가 영원히 진행되지 않는 교착 상태(Deadlock)를 미연에 방지하기 위한 설계 및 구현 기법.
データベースにおけるテーブルの構造を定義する作業。カラム名・データ型・主キー・外部キー・インデックスなどを決定し、正規化やパフォーマンスを考慮して設計する。
데이터베이스에서 테이블의 구조를 정의하는 작업. 컬럼명·데이터 타입·기본 키·외래 키·인덱스 등을 결정하며, 정규화와 성능을 고려하여 설계한다.
データベースに保存されたSQL処理のまとまり。あらかじめコンパイルされているため実行速度が速く、複雑なビジネスロジックをDB側に集約できる。
데이터베이스에 저장된 SQL 처리 묶음. 미리 컴파일되어 있어 실행 속도가 빠르며, 복잡한 비즈니스 로직을 DB 측에 집약할 수 있다.
マルチモデルデータベース。ドキュメント・グラフ・リレーショナルデータを単一DBで扱え、リアルタイムサブスクリプションやサーバーレス動作もサポートする。
멀티모델 데이터베이스. 문서·그래프·관계형 데이터를 단일 DB로 다루고, 실시간 구독과 서버리스 동작도 지원한다.
データベースやシステムにおける主従関係の構成。マスターが書き込みを担当し、スレーブがデータを複製して読み取りを分散処理するアーキテクチャ。
데이터베이스 및 시스템에서의 주종 관계 구성. 마스터가 쓰기를 담당하고, 슬레이브가 데이터를 복제하여 읽기를 분산 처리하는 아키텍처.
データベースのスキーマ変更やデータ移行を、バージョン管理しながら安全に適用・ロールバックできる仕組み。FlywayやLiquibaseなどのツールが代表的。
데이터베이스의 스키마 변경 및 데이터 이전을 버전 관리하면서 안전하게 적용 및 롤백할 수 있는 체계. Flyway, Liquibase 등의 툴이 대표적이다.
Netflix発のオープンテーブル形式。大規模データレイクにACIDトランザクション・スキーマ進化・パーティション最適化を提供し、SparkやTrinoなど多数のエンジンが対応している。
Netflix에서 시작된 오픈 테이블 형식. 대규모 데이터 레이크에 ACID 트랜잭션·스키마 발전·파티션 최적화를 제공하며, Spark나 Trino 등 다수의 엔진이 지원한다.
SQLにおいて、結合条件に一致しない行も含めて結果を返す結合方法。LEFT/RIGHT/FULL OUTER JOINの種類があり、マスタテーブルと明細データの照合などに多用される。
SQL에서 결합 조건에 일치하지 않는 행도 포함하여 결과를 반환하는 조인 방법. LEFT/RIGHT/FULL OUTER JOIN의 종류가 있으며, 마스터 테이블과 상세 데이터 조회 등에 많이 사용된다.
トランザクションDB(OLTP)のデータを、複雑なETLパイプラインを構築・管理することなく、分析用データウェアハウス(OLAP)へほぼリアルタイムに連携・同期する仕組み。
트랜잭션 DB(OLTP)의 데이터를 복잡한 ETL 파이프라인을 구축·관리할 필요 없이 분석용 데이터 웨어하우스(OLAP)로 거의 실시간으로 연계·동기화하는 구조.
データベースの変更(INSERT/UPDATE/DELETE)をリアルタイムで検知・追跡する技術。CDC(Change Data Capture)とも呼ばれ、データ同期やイベント駆動アーキテクチャに活用される。
데이터베이스의 변경(INSERT/UPDATE/DELETE)을 실시간으로 감지·추적하는 기술. CDC(Change Data Capture)라고도 하며, 데이터 동기화나 이벤트 기반 아키텍처에 활용된다.
高次元のベクトルデータを効率的に格納・検索するDBで、AIや機械学習における類似度検索に特化。Pinecone、Weaviate、pgvectorなどが代表的。
고차원 벡터 데이터를 효율적으로 저장·검색하는 DB로, AI 및 머신러닝의 유사도 검색에 특화되어 있다. Pinecone, Weaviate, pgvector 등이 대표적이다.
データベースやUIにおける位置指示子。DBではクエリ結果を行単位で処理する仕組みを指し、UIではマウスポインタや入力位置を示す概念として使われる。
데이터베이스나 UI에서의 위치 지시자. DB에서는 쿼리 결과를 행 단위로 처리하는 메커니즘을 가리키며, UI에서는 마우스 포인터나 입력 위치를 나타내는 개념으로 사용된다.
Online Transaction Processingの略。銀行振込や注文処理など、短時間で多数のトランザクションをリアルタイムに処理するDBの運用形態。
Online Transaction Processing의 약자. 은행 이체나 주문 처리 등 짧은 시간 내에 다수의 트랜잭션을 실시간으로 처리하는 DB 운용 형태.
クエリに必要なすべての列がインデックスに含まれており、テーブル本体へのアクセスなしに結果を返せる最適化されたインデックス設計手法。
쿼리에 필요한 모든 컬럼이 인덱스에 포함되어 있어, 테이블 본체에 접근하지 않고 결과를 반환할 수 있는 최적화된 인덱스 설계 기법.
PostgreSQL向けの軽量コネクションプーラー。データベースへの接続数を制限・再利用することで、大量リクエスト時のリソース消費を抑えパフォーマンスを向上させる。
PostgreSQL용 경량 커넥션 풀러. 데이터베이스 연결 수를 제한하고 재사용하여 대량 요청 시 리소스 소비를 줄이고 성능을 향상시킨다.
分散システムにおいて「一貫性・可用性・分断耐性」の3つを同時に満たすことは不可能であるという定理。設計時のトレードオフ判断に用いられる。
분산 시스템에서 '일관성·가용성·분단 내성' 세 가지를 동시에 만족하는 것은 불가능하다는 정리. 설계 시 트레이드오프 판단에 활용된다.
表の「行」。データ1件分。
표의 "행". 데이터 1건.
テキストデータの全文を対象に高速検索を行うためのインデックス。RDBMSやElasticsearchなどで使用され、LIKE検索より大幅にパフォーマンスが向上する。
텍스트 데이터 전체를 대상으로 고속 검색을 수행하기 위한 인덱스. RDBMS나 Elasticsearch 등에서 사용되며, LIKE 검색보다 성능이 크게 향상된다.
PostgreSQLなどのDBでWrite-Ahead Logを外部ストレージに保存する仕組み。ポイントインタイムリカバリやレプリケーションの基盤となる重要な機能。
PostgreSQL 등 DB에서 Write-Ahead Log를 외부 스토리지에 저장하는 방식으로, 특정 시점 복구(PITR)와 복제의 기반이 되는 중요한 기능입니다.
データを中央集権的に管理するのではなく、各ドメインのチームがデータプロダクトとして所有・提供する分散型のデータアーキテクチャ。
데이터를 중앙 집중적으로 관리하지 않고, 각 도메인 팀이 데이터 프로덕트로서 소유하고 제공하는 분산형 데이터 아키텍처.
継続的に発生するデータ(ストリームデータ)を、到着した端からリアルタイムに処理・分析するアーキテクチャ。バッチ処理と対比され、不正検知やリアルタイムダッシュボードに必須の技術。
지속적으로 발생하는 데이터(스트림 데이터)를 도착하는 즉시 실시간으로 처리·분석하는 아키텍처. 배치 처리와 대비되며, 부정 탐지나 실시간 대시보드에 필수적인 기술.
複数ノードにデータを分散させながらSQL互換のクエリインターフェースを提供するDBシステム。高可用性・水平スケーラビリティとACIDトランザクションを両立する。
여러 노드에 데이터를 분산시키면서 SQL 호환 쿼리 인터페이스를 제공하는 DB 시스템. 고가용성·수평 확장성과 ACID 트랜잭션을 동시에 지원한다.
テーブルの列に入力できる値の条件を定義するSQL制約。条件を満たさないデータはINSERTやUPDATE時にエラーとなり、データの整合性を保つ。
테이블 열에 입력할 수 있는 값의 조건을 정의하는 SQL 제약. 조건을 충족하지 않는 데이터는 INSERT나 UPDATE 시 오류가 발생하며 데이터 정합성을 유지한다.
構造化・非構造化を問わず大量の生データを一元管理するストレージ基盤の設計手法。ETL前の生データをそのまま保持し、後から用途に応じて加工・分析できる柔軟性が特徴。
정형·비정형을 불문하고 대량의 원시 데이터를 일원 관리하는 스토리지 기반 설계 기법. ETL 이전의 원시 데이터를 그대로 보관하여 나중에 용도에 맞게 가공·분석할 수 있는 유연성이 특징.
リレーショナルDBで、別テーブルの主キーを参照するカラム。テーブル間の参照整合性を保ち、関連データの一貫性を担保するために使用される制約。
관계형 DB에서 다른 테이블의 기본 키를 참조하는 컬럼. 테이블 간의 참조 무결성을 유지하고 관련 데이터의 일관성을 보장하기 위해 사용되는 제약 조건.
インターネット経由でアクセスできるデータベースサービス。AWS RDSやGoogle Cloud SQLなど、インフラ管理不要でスケーラブルなDB環境を提供する。
인터넷을 통해 접근할 수 있는 데이터베이스 서비스. AWS RDS, Google Cloud SQL 등 인프라 관리 없이 확장 가능한 DB 환경을 제공한다.
地図や位置情報など2次元・3次元の空間データを高速検索するためのインデックス。R木やQuadtreeなどの構造を用い、GISや位置情報サービスで活用される。
지도나 위치 정보 등 2차원·3차원의 공간 데이터를 고속으로 검색하기 위한 인덱스. R-트리나 쿼드트리 등의 구조를 사용하며, GIS나 위치 정보 서비스에서 활용된다.
複数のカラムを組み合わせて作成するインデックス。検索条件に複数カラムが含まれる場合にクエリパフォーマンスを大幅に向上させる。カラムの順序が重要。
여러 컬럼을 조합하여 생성하는 인덱스. 검색 조건에 여러 컬럼이 포함될 경우 쿼리 성능을 크게 향상시킨다. 컬럼의 순서가 중요하다.
データベースを複数の地理的リージョンに分散配置する構成。障害時の高可用性確保とレイテンシ低減を目的とし、グローバルサービスで広く採用される。
데이터베이스를 여러 지리적 리전에 분산 배치하는 구성. 장애 시 고가용성 확보와 레이턴시 감소를 목적으로 하며, 글로벌 서비스에서 널리 채택된다.
データベース設計においてパフォーマンス向上のため意図的に冗長データを持たせる手法。正規化を崩すトレードオフとして、読み取り速度の改善やJOIN削減が目的。
데이터베이스 설계에서 성능 향상을 위해 의도적으로 중복 데이터를 허용하는 기법입니다. 정규화를 포기하는 트레이드오프로, 읽기 속도 개선과 JOIN 감소를 목적으로 합니다.
DBMSがディスクI/Oを減らすためにデータページをメモリ上にキャッシュする領域。MySQLのInnoDBやSQL Serverで重要なパフォーマンスチューニングのポイントとなる。
DBMS가 디스크 I/O를 줄이기 위해 데이터 페이지를 메모리에 캐시하는 영역. MySQL의 InnoDB나 SQL Server에서 중요한 성능 튜닝 포인트가 된다.
データをクラウドや中央サーバーに送信する前に、データが発生したエッジデバイス(センサー、IoT機器、ルーターなど)側で直接データ分析を行う手法。遅延削減や通信帯域の節約に貢献する。
데이터를 클라우드나 중앙 서버로 전송하기 전에 데이터가 발생한 엣지 디바이스(센서, IoT 기기, 라우터 등) 측에서 직접 데이터 분석을 수행하는 기법. 지연 감소 및 통신 대역폭 절약에 기여한다.
データベースの検索速度を向上させるためのデータ構造。テーブルの特定カラムに作成し、クエリのパフォーマンスを最適化する。ただし更新・挿入時のオーバーヘッドが増加する。
데이터베이스 검색 속도를 향상시키기 위한 데이터 구조. 테이블의 특정 컬럼에 생성하여 쿼리 성능을 최적화한다. 단, 업데이트·삽입 시 오버헤드가 증가한다.
データベースのスキーマ変更履歴をバージョンで管理する手法。マイグレーションファイルを用いてDDL変更を追跡・適用・ロールバックできる仕組みを指す。
데이터베이스 스키마 변경 이력을 버전으로 관리하는 방법론. 마이그레이션 파일을 활용해 DDL 변경을 추적·적용·롤백할 수 있는 구조를 의미한다.
複数件のデータを一括でデータベースに挿入する手法。1件ずつINSERTするより処理速度が大幅に向上し、大量データの初期投入やバッチ処理で広く活用される。
여러 건의 데이터를 데이터베이스에 일괄 삽입하는 기법. 건별 INSERT보다 처리 속도가 크게 향상되며, 대량 데이터 초기 투입이나 배치 처리에서 널리 활용된다.
データの発生元から変換・移動・加工の過程を追跡・可視化する管理手法。データ品質の保証やコンプライアンス対応、障害原因の特定に活用される。
데이터의 발생 원점부터 변환·이동·가공 과정을 추적·시각화하는 관리 기법. 데이터 품질 보증, 컴플라이언스 대응, 장애 원인 파악에 활용된다.
データベースの変更内容をSQL文や行単位の論理レベルで他のDBへ複製する技術。PostgreSQLでは特定テーブルのみを選択的にレプリケーションできる点が特徴。
데이터베이스의 변경 내용을 SQL문이나 행 단위의 논리적 레벨로 다른 DB에 복제하는 기술. PostgreSQL에서는 특정 테이블만 선택적으로 복제할 수 있다는 점이 특징이다.
OLTPとOLAPを単一DBで同時処理するアーキテクチャ。トランザクション処理と分析処理を分離せず、リアルタイムでビジネスインサイトを得られるのが特徴。
OLTP와 OLAP을 단일 DB에서 동시에 처리하는 아키텍처. 트랜잭션 처리와 분석 처리를 분리하지 않고 실시간으로 비즈니스 인사이트를 얻을 수 있는 것이 특징.
データやシステムを別の環境・バージョンへ移行する作業。DBスキーマ変更やクラウド移行など、アプリ開発・インフラ運用の両面で頻繁に発生する重要な工程。
데이터나 시스템을 다른 환경 또는 버전으로 이전하는 작업. DB 스키마 변경이나 클라우드 이전 등 앱 개발과 인프라 운영 양면에서 자주 발생하는 중요한 공정.
データベースのカラムにNULL値を許可するかどうかを定義する制約。NOT NULLを指定すると必須入力となり、データの整合性を保つために重要な設定。
데이터베이스 컬럼에 NULL 값을 허용할지 여부를 정의하는 제약 조건. NOT NULL을 지정하면 필수 입력이 되며, 데이터 무결성을 유지하기 위한 중요한 설정입니다.
高速なOLAP向け列指向データベース管理システム。リアルタイム分析クエリを大規模データに対してミリ秒単位で処理できる。
고속 OLAP용 컬럼형 데이터베이스 관리 시스템. 실시간 분석 쿼리를 대규모 데이터에 대해 밀리초 단위로 처리할 수 있다.
Rustで実装された高性能データフレームライブラリ。Pandasよりも大幅に高速で、列指向メモリフォーマットと並列処理を活用する。
Rust로 구현된 고성능 데이터프레임 라이브러리. Pandas보다 훨씬 빠르며, 컬럼형 메모리 포맷과 병렬 처리를 활용한다.
データベース内のデータが正確・一貫・完全である状態を保つこと。トランザクション管理や制約設定により、矛盾や欠損のないデータを維持する仕組みを指す。
데이터베이스 내의 데이터가 정확하고 일관되며 완전한 상태를 유지하는 것. 트랜잭션 관리와 제약 조건 설정을 통해 모순이나 결손 없는 데이터를 유지하는 구조를 의미한다.
大規模なテーブルやインデックスを論理的・物理的に分割する技術。クエリパフォーマンスの向上やデータ管理の効率化を目的とし、レンジ・ハッシュ・リストなど複数の方式がある。
대규모 테이블이나 인덱스를 논리적·물리적으로 분할하는 기술. 쿼리 성능 향상과 데이터 관리 효율화를 목적으로 하며, 범위·해시·리스트 등 다양한 방식이 존재한다.
高次元ベクトルデータを格納・検索するDBの管理業務。AIの埋め込み表現を活用した類似度検索に特化しており、RAGや推薦システムの基盤として利用される。
고차원 벡터 데이터를 저장·검색하는 DB 관리 업무. AI 임베딩 표현을 활용한 유사도 검색에 특화되어 있으며, RAG 및 추천 시스템의 기반으로 활용된다.
SQLでROW_NUMBER、RANK、LAGなどを使い、行のグループ(ウィンドウ)に対して集計や順位付けを行う関数。GROUP BYと異なり元の行数を保持したまま集計できる。
SQL에서 ROW_NUMBER, RANK, LAG 등을 사용해 행 그룹(윈도우)에 대해 집계나 순위 지정을 수행하는 함수. GROUP BY와 달리 원래 행 수를 유지한 채로 집계할 수 있다.
組織のデータを安全かつ適切に管理するためのルール、ポリシー、プロセス、および組織体制の総称。セキュリティ、プライバシー、データ品質を担保するために不可欠。
조직의 데이터를 안전하고 적절하게 관리하기 위한 규칙, 정책, 프로세스 및 조직 체계의 총칭. 보안, 프라이버시, 데이터 품질을 보장하기 위해 필수적이다.
大量の業務データを分析・意思決定に活用するため、スタースキーマやスノーフレークスキーマなどの手法を用いてDWHを構造的に設計するプロセス。
대량의 업무 데이터를 분석 및 의사결정에 활용하기 위해 스타 스키마, 스노우플레이크 스키마 등의 기법을 사용하여 DWH를 구조적으로 설계하는 프로세스.
データの表。
데이터의 표.
データベース設計において、データの冗長性を排除し、整合性を保つためにテーブルを分割・整理するプロセス。第1〜第3正規形(1NF〜3NF)が基本。
데이터베이스 설계에서 데이터 중복을 제거하고 일관성을 유지하기 위해 테이블을 분리·정리하는 과정으로, 1NF~3NF가 기본 단계입니다.
データベースにおける一連の処理をひとまとまりとして扱う単位。ACID特性(原子性・一貫性・独立性・永続性)を保証し、処理の途中でエラーが発生した場合はロールバックする。
데이터베이스에서 일련의 처리를 하나의 단위로 다루는 개념. ACID 특성(원자성·일관성·독립성·지속성)을 보장하며, 처리 도중 오류가 발생하면 롤백을 수행한다.
データベース内の誤記、表記ゆれ、重複、欠損値などを検出し、修正・削除することでデータの品質を高める処理。「データの前処理」において非常に重要な工程。
데이터베이스 내의 오기, 표기 불일치, 중복, 결측치 등을 감지하고 수정·삭제하여 데이터의 품질을 높이는 처리. '데이터 전처리'에서 매우 중요한 공정.
データベースのインデックス設計・配置を見直し、クエリの検索速度やI/Oコストを改善する手法。不要なインデックスの削除や複合インデックスの活用が含まれる。
데이터베이스의 인덱스 설계 및 배치를 재검토하여 쿼리 검색 속도와 I/O 비용을 개선하는 기법으로, 불필요한 인덱스 삭제 및 복합 인덱스 활용 등이 포함된다.
複数の顧客(テナント)が同一DBを共有するSaaSアーキテクチャ設計手法。データ分離方式としてスキーマ共有・スキーマ分離・DB分離の3パターンが存在する。
여러 고객(테넌트)이 동일한 DB를 공유하는 SaaS 아키텍처 설계 기법으로, 데이터 격리 방식에는 스키마 공유·스키마 분리·DB 분리의 3가지 패턴이 있다.
データの収集・加工・転送・蓄積を自動化する一連の処理フローのこと。ETLやストリーミング処理など様々な形態があり、データ基盤の中核を担う仕組み。
데이터의 수집·가공·전송·저장을 자동화하는 일련의 처리 흐름. ETL 및 스트리밍 처리 등 다양한 형태가 있으며, 데이터 인프라의 핵심 구조를 담당한다.
プライマリDBのデータを非同期または同期でコピーし、読み取り専用クエリを分散処理するDBインスタンス。書き込み負荷をプライマリに集中させず、スケールアウトを実現する。
프라이머리 DB의 데이터를 비동기 또는 동기 방식으로 복제하여 읽기 전용 쿼리를 분산 처리하는 DB 인스턴스. 쓰기 부하를 프라이머리에 집중시키지 않고 스케일 아웃을 실현한다.
リレーショナルDB以外のデータベース総称。ドキュメント型・キーバリュー型・グラフ型などがあり、大規模データや柔軟なスキーマが必要な場面で採用される。
관계형 DB가 아닌 데이터베이스의 총칭. 도큐먼트형·키-밸류형·그래프형 등이 있으며, 대규모 데이터나 유연한 스키마가 필요한 경우에 채택된다.
データベースで特定のカラムに重複した値が入らないよう保証する制約。主キー以外のカラムにも設定でき、NULLは複数許容される場合がある。
데이터베이스에서 특정 컬럼에 중복된 값이 입력되지 않도록 보장하는 제약 조건. 기본 키 외의 컬럼에도 설정할 수 있으며, NULL은 여러 개 허용되는 경우가 있다.
分散システムにおける可用性重視の設計原則。Basically Available・Soft state・Eventually consistentの頭文字で、ACIDに対比する概念。NoSQLで多く採用される。
분산 시스템에서 가용성을 중시하는 설계 원칙. Basically Available·Soft state·Eventually consistent의 머리글자로, ACID에 대비되는 개념이며 NoSQL에서 많이 채택된다.
DBへのクエリ結果をメモリに一時保存し、同一クエリの再実行時にDBアクセスを省略して高速にレスポンスを返す仕組み。読み取り負荷の軽減に有効。
DB에 대한 쿼리 결과를 메모리에 임시 저장하여, 동일한 쿼리 재실행 시 DB 접근을 생략하고 빠르게 응답을 반환하는 구조. 읽기 부하 감소에 효과적이다.
時刻をキーとして時系列データを効率的に保存・検索するDBMS。IoTセンサーや監視メトリクスの蓄積に特化しており、InfluxDBやPrometheusが代表例。
시간을 키로 시계열 데이터를 효율적으로 저장·조회하는 DBMS. IoT 센서나 모니터링 메트릭 수집에 특화되어 있으며, InfluxDB와 Prometheus가 대표적인 예시입니다.
データベースのブロックレベルでデータをそのままコピーするレプリケーション方式。PostgreSQLなどで採用され、ディスク上の物理的なデータ構造ごと複製するため高速で信頼性が高い。
데이터베이스의 블록 레벨에서 데이터를 그대로 복사하는 복제 방식입니다. PostgreSQL 등에서 채택되며, 디스크상의 물리적 데이터 구조째로 복제하기 때문에 빠르고 신뢰성이 높습니다.
SQLで特定の列を基準にデータをグループ化する句。集計関数(COUNT、SUM、AVGなど)と組み合わせてグループごとの集計結果を取得する際に使用する。
SQL에서 특정 컬럼을 기준으로 데이터를 그룹화하는 절. 집계 함수(COUNT, SUM, AVG 등)와 조합하여 그룹별 집계 결과를 조회할 때 사용한다.
クエリ結果を物理的に保存したビュー。通常のビューと異なり、データを実体化して保持するため高速な参照が可能だが、定期的なリフレッシュが必要。
쿼리 결과를 물리적으로 저장한 뷰. 일반 뷰와 달리 데이터를 실체화하여 보유하므로 빠른 참조가 가능하지만, 정기적인 갱신이 필요하다.
アプリケーションに組み込まれて動作する軽量DBエンジン。SQLiteやH2などが代表的で、サーバー不要で単体動作が可能なため、モバイルやIoT機器でも広く使われる。
애플리케이션에 내장되어 동작하는 경량 DB 엔진. SQLite나 H2 등이 대표적이며, 별도 서버 없이 단독 실행이 가능해 모바일 및 IoT 기기에서도 널리 사용된다.
Uberが開発したストリーミング対応のオープンテーブル形式。データレイク上でのUPSERT・DELETE・インクリメンタル処理を効率的に行え、変更データキャプチャにも対応する。
Uber가 개발한 스트리밍 대응 오픈 테이블 형식. 데이터 레이크 상에서 UPSERT·DELETE·증분 처리를 효율적으로 수행할 수 있으며, 변경 데이터 캡처에도 대응한다.
データベースを複数のサーバーに水平分割して分散保存する手法。大規模データの負荷分散やスケールアウトを実現するために使われる。
데이터베이스를 여러 서버에 수평 분할하여 분산 저장하는 기법. 대규모 데이터의 부하 분산 및 스케일 아웃을 실현하기 위해 사용된다.
複数のトランザクションやスレッドが同時にデータへアクセスする際、整合性を保つための制御技術。ロック・楽観的ロック・MVCCなどの手法がある。
여러 트랜잭션이나 스레드가 동시에 데이터에 접근할 때 일관성을 유지하기 위한 제어 기술로, 락·낙관적 락·MVCC 등의 방법이 있다.
データを列単位で格納するDBMS。分析クエリや集計処理に強く、BigQueryやRedshiftなどのDWH製品に広く採用されている。行指向DBと対比される。
데이터를 열 단위로 저장하는 DBMS. 분석 쿼리와 집계 처리에 강하며, BigQuery나 Redshift 등의 DWH 제품에 널리 채택되고 있다. 행 지향 DB와 대비된다.
データをソースから抽出(Extract)し、そのままターゲットDBにロード(Load)した後に変換(Transform)する処理フロー。クラウドDWH環境で主流となっている手法。
데이터를 소스에서 추출(Extract)하고 대상 DB에 그대로 로드(Load)한 후 변환(Transform)하는 처리 흐름으로, 클라우드 DWH 환경에서 주류 방식으로 자리 잡고 있다.
データベース設計の初期フェーズで行うEntity-Relationship図の作成。エンティティ間の関係性や属性を視覚化し、テーブル構造の基盤を定義する手法。
데이터베이스 설계 초기 단계에서 수행하는 ER 다이어그램 작성. 엔티티 간의 관계와 속성을 시각화하여 테이블 구조의 기반을 정의하는 방법론.
データを複数のノードやサーバに分散して保存・管理するデータベース方式。スケーラビリティと可用性を高め、単一障害点を排除できる。CassandraやDynamoDBが代表例。
데이터를 여러 노드나 서버에 분산하여 저장·관리하는 데이터베이스 방식. 확장성과 가용성을 높이고 단일 장애점을 제거할 수 있다. Cassandra나 DynamoDB가 대표적인 예이다.
組織内に分散するデータソースを論理的に統合し、エンドユーザーがデータの場所を意識せずに一元的にアクセスできるようにするデータ管理アーキテクチャ。
조직 내 분산된 데이터 소스를 논리적으로 통합하여, 엔드 유저가 데이터 위치를 신경 쓰지 않고 통합적으로 접근할 수 있도록 하는 데이터 관리 아키텍처.
Databricksが開発したオープンソースのデータレイク形式。ACIDトランザクション・スキーマ適用・タイムトラベルをデータレイクに追加し、信頼性の高いデータレイクハウスを実現する。
Databricks가 개발한 오픈소스 데이터 레이크 형식. ACID 트랜잭션·스키마 적용·타임 트래블을 데이터 레이크에 추가하여, 신뢰성 높은 데이터 레이크하우스를 실현한다.
データを表(テーブル)形式で管理し、SQL を用いてテーブル間の関係を定義・操作するデータベース管理システム。MySQL、PostgreSQL、Oracle などが代表例。
데이터를 표(테이블) 형식으로 관리하고, SQL을 사용하여 테이블 간의 관계를 정의·조작하는 데이터베이스 관리 시스템. MySQL, PostgreSQL, Oracle 등이 대표적인 예시.
複数トランザクションが同時実行される際のデータ整合性と分離度を定義するDB設定。READ UNCOMMITTED〜SERIALIZABLEの4段階があり、性能と一貫性のトレードオフを調整する。
여러 트랜잭션이 동시에 실행될 때 데이터 정합성과 격리 수준을 정의하는 DB 설정. READ UNCOMMITTED부터 SERIALIZABLE까지 4단계가 있으며, 성능과 일관성 간의 트레이드오프를 조정한다.
データベースやシステムで特定のイベント発生時に自動的に実行される処理のこと。INSERT・UPDATE・DELETE操作をきっかけにストアドプロシージャなどを起動する仕組み。
데이터베이스나 시스템에서 특정 이벤트 발생 시 자동으로 실행되는 처리를 말한다. INSERT·UPDATE·DELETE 작업을 계기로 저장 프로시저 등을 실행하는 메커니즘이다.
データをディスクではなくメインメモリ上に保持するDBMS。アクセス速度が極めて高速で、キャッシュやセッション管理、リアルタイム処理などに活用される。代表例はRedis、Memcached。
데이터를 디스크가 아닌 메인 메모리에 저장하는 DBMS. 접근 속도가 매우 빠르며, 캐시, 세션 관리, 실시간 처리 등에 활용된다. 대표적인 예로 Redis, Memcached가 있다.
インプロセス動作する列指向分析データベース。SQLiteのように組み込みで使えながら、OLAPワークロードで高速な分析クエリを実行できる。
인프로세스로 동작하는 컬럼형 분석 데이터베이스. SQLite처럼 내장으로 사용하면서 OLAP 워크로드에서 고속 분석 쿼리를 실행할 수 있다.
データをExtract(抽出)・Transform(変換)・Load(格納)の3工程で処理し、データウェアハウスや分析基盤へ投入する一連の自動化フローのこと。
데이터를 Extract(추출)·Transform(변환)·Load(적재)의 3단계로 처리하여 데이터 웨어하우스나 분석 인프라에 투입하는 일련의 자동화 흐름을 말한다.
複数のカラムを組み合わせて一意性を識別するキー。単一カラムでは一意にできない場合に使用し、主キーや外部キーとして設定されることが多い。
여러 컬럼을 조합하여 고유성을 식별하는 키. 단일 컬럼으로 고유성을 보장할 수 없을 때 사용하며, 기본 키나 외래 키로 설정되는 경우가 많다.
データベースに初期データやテストデータを投入するプロセス。開発・テスト環境のセットアップや本番環境の初期データ登録に使われる手法。
데이터베이스에 초기 데이터나 테스트 데이터를 삽입하는 프로세스. 개발·테스트 환경 구축이나 운영 환경의 초기 데이터 등록에 사용되는 기법.
SQLクエリをDBがどのように実行するかを示す計画。EXPLAINコマンドで取得し、インデックスの使用有無やテーブルスキャンの方式を確認してクエリチューニングに活用する。
SQL 쿼리를 DB가 어떻게 실행할지 보여주는 계획. EXPLAIN 명령으로 확인하며, 인덱스 사용 여부와 테이블 스캔 방식을 파악해 쿼리 튜닝에 활용한다.
物理的にデータを移動・コピーすることなく、複数の異なるデータソースを統合して単一の論理的なデータ層として提供する技術。
물리적으로 데이터를 이동하거나 복사하지 않고, 여러 다른 데이터 소스를 통합하여 단일 논리적 데이터 계층으로 제공하는 기술.
行ごとに異なるカラムを持てる分散型NoSQLデータベース。Apache CassandraやHBaseが代表例で、大規模な時系列データや高書き込み負荷に強い。
행마다 다른 컬럼을 가질 수 있는 분산형 NoSQL 데이터베이스. Apache Cassandra와 HBase가 대표적이며, 대규모 시계열 데이터나 높은 쓰기 부하에 강하다.
PostgreSQLにおける不要な行データ(デッドタプル)を回収し、テーブルの肥大化を防ぐメンテナンス処理。VACUUM/ANALYZE コマンドや自動実行のautovacuumで管理する。
PostgreSQL에서 불필요한 행 데이터(데드 튜플)를 회수하여 테이블 비대화를 방지하는 유지보수 처리. VACUUM/ANALYZE 명령어나 자동 실행 autovacuum으로 관리한다.
Multi-Version Concurrency Controlの略。DBがデータの複数バージョンを保持することで、読み取りと書き込みが互いをブロックせず並行処理を実現するトランザクション管理方式。PostgreSQLやInnoDBで採用。
Multi-Version Concurrency Control의 약자. DB가 데이터의 여러 버전을 유지함으로써 읽기와 쓰기가 서로를 블로킹하지 않고 동시 처리를 실현하는 트랜잭션 관리 방식. PostgreSQL과 InnoDB에서 채택.
データベースの変更イベントをリアルタイムでキャプチャし、他システムへ連携するCDC(変更データキャプチャ)サービス。GCPが提供するマネージドサービスとして広く利用される。
데이터베이스의 변경 이벤트를 실시간으로 캡처하여 다른 시스템으로 연계하는 CDC(변경 데이터 캡처) 서비스. GCP가 제공하는 매니지드 서비스로 널리 활용된다.
データベースへの接続を事前に複数確保しておき、再利用することでオーバーヘッドを削減する仕組みの管理。DBアクセスの高速化とリソース最適化に不可欠。
데이터베이스 연결을 미리 여러 개 확보해두고 재사용함으로써 오버헤드를 줄이는 구조의 관리. DB 접근 속도 향상과 리소스 최적화에 필수적이다.
顧客、商品、従業員など、企業のビジネスの中核となる基本データ(マスターデータ)を組織全体で一元的に統合・管理し、常に正確で最新の状態に保つ取り組み。
고객, 상품, 직원 등 기업 비즈니스의 핵심이 되는 기본 데이터(마스터 데이터)를 조직 전체에서 통합 관리하여 항상 정확하고 최신 상태로 유지하는 활동.
データの正確性・完全性・一貫性・適時性などを継続的に監視・改善するプロセス。DQM(Data Quality Management)とも呼ばれ、分析精度やシステム信頼性に直結する。
데이터의 정확성·완전성·일관성·적시성 등을 지속적으로 모니터링하고 개선하는 프로세스. DQM이라고도 하며, 분석 정확도와 시스템 신뢰성에 직결된다.
ElasticsearchからフォークされたオープンソースのAWS主導の検索・分析エンジン。ログ分析や全文検索、リアルタイムデータ可視化に広く活用される。
Elasticsearch에서 포크된 오픈소스 AWS 주도의 검색·분석 엔진. 로그 분석, 전문 검색, 실시간 데이터 시각화에 널리 활용된다.
Write-Ahead Loggingの略。データ変更をディスクに書き込む前に、先にログを記録する手法。PostgreSQLなどで採用され、クラッシュリカバリやレプリケーションに活用される。
Write-Ahead Logging의 약자. 데이터 변경 사항을 디스크에 쓰기 전에 먼저 로그를 기록하는 기법. PostgreSQL 등에서 채택되며, 크래시 복구 및 레플리케이션에 활용된다.
構造化・非構造化を問わず大量の生データを一元的に蓄積するストレージリポジトリ。スキーマ定義を後回しにできるため、柔軟なデータ分析基盤として活用される。
정형·비정형을 막론하고 대량의 원시 데이터를 일원적으로 저장하는 스토리지 리포지토리. 스키마 정의를 나중에 할 수 있어 유연한 데이터 분석 기반으로 활용된다.
実行に時間がかかるDBクエリのこと。一定の閾値を超えたSQLをログに記録し、パフォーマンスのボトルネック特定・チューニングに活用する。
실행에 시간이 오래 걸리는 DB 쿼리를 말한다. 일정 임계값을 초과한 SQL을 로그에 기록하여 성능 병목 지점 파악 및 튜닝에 활용한다.
データベース設計においてエンティティ・属性・リレーションを整理し、ER図や正規化などを用いてデータ構造を体系的に定義するアプローチ。
데이터베이스 설계 시 엔티티·속성·관계를 정리하고, ER 다이어그램이나 정규화 등을 활용해 데이터 구조를 체계적으로 정의하는 방법론입니다.
データベーストランザクションの信頼性を保証する4つの性質。原子性・一貫性・独立性・耐久性の頭文字を取ったもので、データ整合性の基盤となる概念。
데이터베이스 트랜잭션의 신뢰성을 보장하는 4가지 속성. 원자성·일관성·격리성·지속성의 앞 글자를 딴 것으로, 데이터 정합성의 핵심 개념이다.
位置情報や地形・地域の形状などを含むデータ。GISや地図アプリ、物流システムなどで活用され、PostGISやBigQuery GeoなどのDB拡張で処理される。
위치 정보나 지형·지역의 형상 등을 포함한 데이터. GIS 및 지도 앱, 물류 시스템 등에 활용되며, PostGIS나 BigQuery Geo 등의 DB 확장 기능으로 처리된다.
DBMSがSQLクエリを実行する際に、最も効率的な実行計画を自動的に選択・生成するコンポーネント。インデックスの利用可否やテーブルの統計情報をもとに最適なアクセスパスを決定する。
DBMS가 SQL 쿼리를 실행할 때 가장 효율적인 실행 계획을 자동으로 선택·생성하는 컴포넌트. 인덱스 사용 가능 여부와 테이블 통계 정보를 바탕으로 최적의 액세스 경로를 결정한다.
DBMSがSQLを実行する際の処理手順を可視化した実行計画を解析し、インデックス使用状況やコストを確認してクエリのパフォーマンスを最適化する作業。
DBMS가 SQL을 실행할 때의 처리 절차를 시각화한 실행 계획을 분석하여, 인덱스 사용 현황과 비용을 확인하고 쿼리 성능을 최적화하는 작업.
RDBMSのACID特性を維持しながら、NoSQLのような水平スケーラビリティを実現する次世代分散データベースの総称。Google SpannerやCockroachDBが代表例。
RDBMS의 ACID 특성을 유지하면서 NoSQL과 같은 수평 확장성을 실현하는 차세대 분산 데이터베이스의 총칭. Google Spanner와 CockroachDB가 대표적인 예시이다.