KG Pipelines Flashcards

Question 1

Q

What are the four main stages of the KG‑RAG pipeline for QA?

Answer

A

1) Query Generation 2) Knowledge Retrieval 3) Context Construction 4) Answer Generation

Question 2

Q

Step 1: Query Generation – tasks and common approaches

Answer

A

Tasks: Entity linking, relation extraction, SPARQL/Cypher query construction.
Approaches:
• Template‑based patterns
• Neural NL→SPARQL models
• LLM‑based query prompting
• Hybrid combinations

Question 3

Q

Step 2: Knowledge Retrieval – strategies and challenges

Answer

A

Strategies:
• Direct SPARQL/Cypher execution
• Vector retrieval via KG embeddings
• Path ranking for multi‑hop
• Graph traversal for complex queries
Challenges: Ambiguous entities, KG incompleteness, precision vs recall, query optimization

Question 4

Q

Step 3: Context Construction – methods and formats

Answer

A

Methods: Subgraph extraction → linearization → enrichment → prioritization
Formats:
• Triplet lists
• Natural‑language verbalizations
• Structured JSON
• Hybrid

Question 5

Q

Step 4: Answer Generation – LLM techniques

Answer

A

Techniques:
• Prompt engineering
• In‑context examples
• Chain‑of‑thought prompting
• Output verification
Advanced:
• KG‑specific fine‑tuning
• ReAct reasoning
• Self‑consistency checks
• Explainability layers

Question 6

Q

Designing a KG‑RAG pipeline – key decision factors

Answer

A

Question 7

Q

Justifying pipeline step selection

Answer

A

Question 8

Q

Potential privacy issues in KG‑RAG pipelines

Answer

A

Exposure of sensitive entities or relationships
Leakage of user queries via logs or prompts
Inference of personal data through embeddings
Mitigations: Anonymization, access control, minimal context

Question 9

Q

Potential quality issues in KG‑RAG pipelines

Answer

A

KG incompleteness or stale data
Retrieval precision vs recall trade‑offs
LLM hallucinations despite correct context
Context truncation or snippet bias
Mitigations: KG curation, hybrid retrieval, output verification

(9 cards)