🎥 SEMANTIC VIDEO RETRIEVAL SYSTEM

A production-ready, multimodal video retrieval system that matches videos to natural language queries using powerful vision-language models and LLMs. This system enables semantic video search by leveraging frame-level visual summaries and enriched audio transcripts, all indexed in a vector database for blazing-fast similarity search.

✨ Features

🔍 Natural Language Video Search: Find relevant videos using everyday language.
🧠 Multimodal Understanding: Combines visual and audio information for richer context.
🖼️ Visual Summarization: Extracts key frames (1 FPS) and generates meaningful summaries using a vision-language model.
🎙️ Audio Transcript Enrichment: Converts speech to text and integrates it with visual data.
⚡ Fast Retrieval: Stores embeddings and metadata in a vector database for efficient semantic search.
🧪 Scalable & Production-Ready: Clean architecture ready for deployment and scaling.

🧠 Tech Stack

Component	Technology
Language	Python
Visualsummary Model	BLIP
Vector DB	Chroma
Audio Processing	ffmpeg, pydub
Frame Extraction	OpenCV
Deployment	Streamlit

🚀 Getting Started

RUN run.py using |streamlit run| command in CLI using seperate environmet to get streamlit UI as local webhost.

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
README.md		README.md
database.py		database.py
preprocessing.py		preprocessing.py
requirements.txt		requirements.txt
run.py		run.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🎥 SEMANTIC VIDEO RETRIEVAL SYSTEM

✨ Features

🧠 Tech Stack

🚀 Getting Started

About

Uh oh!

Releases

Packages

Uh oh!

Languages

jayanthk82/Semantic-Video-Retrieval-System

Folders and files

Latest commit

History

Repository files navigation

🎥 SEMANTIC VIDEO RETRIEVAL SYSTEM

✨ Features

🧠 Tech Stack

🚀 Getting Started

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages