— ML Engineering
Taxi Price Prediction
Förutsäger taxipriser utifrån resedetaljer plus realtidsdata för avstånd, trafik och väder - en GradientBoosting-modell bakom en FastAPI- och Streamlit-app.
Scikit-learn Python FastAPI Streamlit GradientBoosting
~ när Sep 2025 – Okt 2025
~ status Arkiverad
~ typ Skolprojekt
En end-to-end ML-applikation som förutsäger taxipriser genom att integrera reseparametrar med extern realtidsdata. Byggd som kursarbete för OPA24 AI Engineering.
Data och features
- Google Places API för adressuppslagning och autokomplettering
- Google Routes API för avståndsberäkning med trängselprognos utifrån avresetid
- Väderintegration via Google Weather API - mappar förhållanden till prismultiplikatorer (Klart: 1,0x, Regn: 1,15x, Snö: 1,3x)
- Trafikmultiplikatorer - Låg: 1,0x, Medel: 1,1x, Hög: 1,25x
- 97,7% av ursprungsdatasetet bevarades genom intelligent datarensning
Modellprestanda
- GradientBoosting nådde 15,56 USD MAE med 0,828 R² på 196 testexempel
- Slog LinearRegression (17,00 USD MAE) och RandomForest (15,91 USD MAE)
- Avståndsbaserade features dominerar med 61% betydelse, interaktionsfeatures (avstånd × förhållanden) med 37%
Arkitektur
- FastAPI-backend som serverar den tränade modellen via REST-endpoint med Pydantic-validering
- Streamlit-frontend med dashboard i flera sidor - prestandamått, datautforskning och uppdelning av prediktioner
- Serialiserad modell via joblib för snabb inferens
Om diagrammet
Varje axel är en funktionell pelare; det orange visar var mitt fokus låg, det lila hur stor del av arbetet som var AI-förstärkt. Det AI-lagret är där verktyg snabbade upp implementationen - arkitektur, kodgranskning och kvalitetsnivån är mina egna. Jag använder AI som precisionsverktyg med strikta konventioner, inte autopilot.