Dheer Gupta | Data Science & AI Engineer

Experience

Where I've Made Impact

Startup Dec. 2024 - Present

Founder & AI Engineer

HomeRelay

AI-Powered Property Maintenance Platform

The Problem

Property managers handle hundreds of tenant maintenance calls, including many after hours. Missed calls mean unhappy tenants, delayed repairs, and liability risks. Manual call logging and technician dispatch is time-consuming and error-prone.

What I Built

An AI-powered platform where tenants call a property number, an AI voice agent answers 24/7, diagnoses the issue, creates a ticket, and auto-dispatches the right technician.

Technical Implementation

Voice AI Vapi (24/7 conversational agent)

Backend Express.js, Node.js, TypeScript

Database PostgreSQL, Prisma ORM

Frontend Next.js, React, TailwindCSS

Auth NextAuth.js, JWT, RBAC

DevOps Docker, GitHub Actions, Vercel

Actionable Outcomes

For Property Managers

24/7 call coverage: No missed tenant calls. AI agent answers, gathers details, creates tickets automatically
Instant categorization: AI extracts issue type, priority level, and unit number from natural conversation
Auto dispatch: System matches issues to technicians by specialty, location, and schedule
Real-time visibility: Dashboard shows open tickets, transcripts, technician status, and metrics

For Technicians

Mobile-first portal: View assignments, update status, manage availability
Smart scheduling: Weekly availability editor, time-off requests, on-call toggling
Performance tracking: Completion rates, resolution times, ratings

Quantified Capabilities

9 Issue Categories HVAC, Plumbing, Electrical, Appliance, Lockout, Pest, Structural, Landscaping, General

500 Events/Minute Webhook throughput capacity

3 User Portals Admin, Property Manager, Technician

4 Subscription Tiers Free, Basic, Pro, Enterprise

Voice AI TypeScript Next.js PostgreSQL Docker

Research Feb. 2025 - Jun. 2025

Data Science Researcher

Knox College

Cyber Threat Intelligence Platform

The Problem

Security teams face information overload with thousands of CVEs published yearly, scattered threat intelligence, and no clear prioritization. Manual triage is slow, leading to delayed patching of critical vulnerabilities.

What I Built

An end-to-end automated threat intelligence pipeline that ingests vulnerability data, classifies threats, detects emerging attacks, and prioritizes CVEs for security teams.

Technical Implementation

Data Ingestion NVD API 2.0, Web Scraping

NLP Pipeline NLTK, Regex, Custom Preprocessing

Classification Random Forest, SBERT, TF-IDF

Anomaly Detection Isolation Forest, Z-score

Visualization Streamlit, Plotly Dashboard

Deployment Docker Containerization

Actionable Outcomes

Automated threat categorization: Auto-labels threats as XSS, SQL Injection, Ransomware, etc., enabling filtered views by attack type
Prioritized patching queue: Urgency scores rank vulnerabilities so teams patch the most dangerous first
Early warning system: Anomaly detection flags zero-day indicators and mention spikes before widespread exploitation

Quantified Impact

                                    7x
                                    Improvement
                                    High-urgency detection: 4.7% to 32.5%
                                

178,796 Records Processed CVEs and threat reports

0.98 F1-Score (XSS) 1.00 precision, 0.96 recall

0.84 F1-Score (SQLi) 0.84 precision, 0.84 recall

Classification Performance

Threat Category	Precision	Recall	F1-Score
XSS	1.00	0.96	0.98
Phishing	0.99	0.73	0.84
SQL Injection	0.84	0.84	0.84
Malware	0.97	0.73	0.83
Supply Chain	0.95	0.72	0.82

Urgency Scoring System

45% CVSS Severity

25% Patch Status

15% Sentiment

10% Exploit Indicators

5% Recency

Distribution: 12.1% Low | 55.3% Medium | 32.5% High Embedding Speed: 1,447 texts/second

Python Machine Learning NLP SBERT Docker

Collaboration Mar. 2025 - Jun. 2025

Data Engineer

MACRO Consortium

Astronomy Image Management System

Macalester, Augustana, Coe, Knox College, University of Iowa

The Problem

The Robert L. Mutel Telescope generates hundreds of astronomical images nightly (~14GB per night). Without a centralized system, researchers across 5 institutions could not efficiently search, filter, or access observation data.

What I Built

An automated astronomical data pipeline that ingests FITS images in real-time, extracts 40+ metadata parameters, scores image quality, and provides a searchable interface for researchers across all consortium institutions.

Technical Implementation

Backend API FastAPI, Python 3.12

Database MySQL 8.0, SQLAlchemy

File Processing Astropy (FITS extraction)

Auth Google OAuth 2.0, JWT

Monitoring Watchdog (real-time detection)

Infrastructure Docker, Nginx, 5 microservices

Actionable Outcomes

For Astronomers/Researchers

Instant data access: Query observations by date, filter type, temperature, quality score, target object in <1 second
Quality filtering: Automated scoring flags research-grade images so astronomers focus on usable data
Cross-institutional access: Students and faculty from all 5 MACRO schools query the same centralized database

For Observatory Operations

Zero-touch ingestion: New observation files detected and processed automatically
Continuous operation: Designed for robotic telescope running unattended multi-night campaigns

Quantified Capabilities

~14GB Nightly Data 400-500 FITS images per night

40+ Parameters Metadata extracted per image

<1s Query Time Multi-parameter search response

100% Accuracy Metadata extraction accuracy

Quality Scoring Algorithm

+20 Exposure time >30s

+20 Airmass <1.5

+30 Science frame type

+10 Standard filter (R,G,B,L)

Quality flag = True when score ≥ 60%

FastAPI MySQL Astropy Docker OAuth2

Contract Dec. 2025 - Jan. 2026

Digital Annotation Expert

Mercor

AI Training Data & Model Evaluation

What I Did

Evaluated and annotated multimodal AI outputs (audio, images, video) to improve model accuracy and reliability for production AI systems.

AI/ML Significance

Evaluate AI-generated outputs Model quality assessment

Compare results, select best RLHF pipeline contribution

Tag/annotate multimedia Training data creation

Follow consistency guidelines Data quality assurance

Actionable Outcomes

Training data creation: Tagged and annotated multimedia content used to train multimodal AI systems
Model evaluation: Compared AI-generated results and selected highest quality outputs, contributing to RLHF feedback loops
Quality assurance: Maintained consistency in AI training data following project guidelines
Multimodal AI improvement: Directly contributed to improving accuracy and reliability of production AI systems

RLHF Data Annotation Multimodal AI Quality Assurance

Part-time Sep. 2022 - Jun. 2025

ITS Lab Assistant

Knox College

Information Technology Services

What I Did

Provided technical support across 5 campus computer labs for nearly 3 years, troubleshooting hardware, software, and network issues for students and faculty.

Responsibilities

Technical troubleshooting: Diagnosed and resolved hardware, software, and network connectivity issues across Windows and Mac systems
User support: Assisted users with printing, login issues, application problems, and general IT inquiries
Network troubleshooting: Identified and resolved connectivity issues, escalating complex problems to network administrators
Access management: Routed IAM and access control issues to IT administrators; directed users to Help Desk for ticket generation

Skills Demonstrated

Technical Troubleshooting Customer Service Problem Escalation IT Ticketing Workflows Multi-platform Support

Technical Support Problem Solving Windows Mac

Hi, I'm Dheer Gupta

Turning Data Into Decisions

Where I've Made Impact

Founder & AI Engineer

The Problem

What I Built

Technical Implementation

Actionable Outcomes

For Property Managers

For Technicians

Quantified Capabilities

Data Science Researcher

The Problem

What I Built

Technical Implementation

Actionable Outcomes

Quantified Impact

Classification Performance

Urgency Scoring System

Data Engineer

The Problem

What I Built

Technical Implementation

Actionable Outcomes

For Astronomers/Researchers

For Observatory Operations

Quantified Capabilities

Quality Scoring Algorithm

Digital Annotation Expert

What I Did

AI/ML Significance

Actionable Outcomes

ITS Lab Assistant

What I Did

Responsibilities

Skills Demonstrated

What I've Built

Cyber Threat Intelligence

Astronomy Image Management System

Yelp Data Mining Project

Netflix Recommendation System

Data Breaches Severity Research

Solar System 3D

Vapi Webhook Handler

Midnight

Minesweeper

Haskell Tic-Tac-Toe

Simple HTTP Server

PentestGPT

Technical Expertise

Data Science & ML

Cybersecurity

Data Engineering

AI/ML Engineering

Tools & Technologies

Certifications

Let's Connect