EN
← Tillbaka till kod
— ML Engineering

Taxi Price Prediction

Förutsäger taxipriser utifrån resedetaljer plus realtidsdata för avstånd, trafik och väder - en GradientBoosting-modell bakom en FastAPI- och Streamlit-app.

Scikit-learn Python FastAPI Streamlit GradientBoosting
~ när Sep 2025 – Okt 2025
~ status Arkiverad
~ typ Skolprojekt

En end-to-end ML-applikation som förutsäger taxipriser genom att integrera reseparametrar med extern realtidsdata. Byggd som kursarbete för OPA24 AI Engineering.

Data och features

  • Google Places API för adressuppslagning och autokomplettering
  • Google Routes API för avståndsberäkning med trängselprognos utifrån avresetid
  • Väderintegration via Google Weather API - mappar förhållanden till prismultiplikatorer (Klart: 1,0x, Regn: 1,15x, Snö: 1,3x)
  • Trafikmultiplikatorer - Låg: 1,0x, Medel: 1,1x, Hög: 1,25x
  • 97,7% av ursprungsdatasetet bevarades genom intelligent datarensning

Modellprestanda

  • GradientBoosting nådde 15,56 USD MAE med 0,828 R² på 196 testexempel
  • Slog LinearRegression (17,00 USD MAE) och RandomForest (15,91 USD MAE)
  • Avståndsbaserade features dominerar med 61% betydelse, interaktionsfeatures (avstånd × förhållanden) med 37%

Arkitektur

  • FastAPI-backend som serverar den tränade modellen via REST-endpoint med Pydantic-validering
  • Streamlit-frontend med dashboard i flera sidor - prestandamått, datautforskning och uppdelning av prediktioner
  • Serialiserad modell via joblib för snabb inferens
AI & ML ModelingCore LogicInfrastructure & APIFrontend & UI
Om diagrammet
Varje axel är en funktionell pelare; det orange visar var mitt fokus låg, det lila hur stor del av arbetet som var AI-förstärkt. Det AI-lagret är där verktyg snabbade upp implementationen - arkitektur, kodgranskning och kvalitetsnivån är mina egna. Jag använder AI som precisionsverktyg med strikta konventioner, inte autopilot.