Lekce 1Filtrační techniky: WHERE vs HAVING, použití EXISTS, IN, korelované poddotazyVyvíjejte přesné filtrační strategie pro analytické dotazy. Porovnáte WHERE a HAVING, použijete EXISTS a IN pro filtry poddotazů a aplikujete korelované poddotazy pro vyjádření komplexních podmínek závislých na řádcích.
WHERE vs HAVING ve skupinových dotazechPoužití IN a NOT IN s poddotazyEXISTS a NOT EXISTS pro semi spojeKorelované poddotazy pro logiku závislou na řádcíchZpracování NULL hodnot ve filtračních podmínkáchTipy na výkon pro komplexní filtryLekce 2Datové typy SQL a zpracování datum/čas (DATE, TIMESTAMP, numerická přesnost)Naučte se hlavní datové typy SQL používané v analýze a jak ovlivňují úložiště, přesnost a výpočty. Pochopte numerické stupnice, zpracování textu a robustní operace s daty a časovými razítky pro analýzu založenou na čase.
Numerické typy a přesnost pro metrikyZohlednění znakových a textových datDATE vs TIMESTAMP a časová pásmaPřetypování a konverze mezi typyAritmetika s daty a výpočty intervalůExtrakce částí datumů pro seskupováníLekce 3Agregace a seskupování: GROUP BY, HAVING, COUNT, SUM, AVG, MIN, MAXNaučte se shrnovat data pomocí agregací a seskupování. Používejte GROUP BY a HAVING pro tvorbu metrik, aplikujte COUNT, SUM, AVG, MIN a MAX a navrhujte robustní agregační dotazy pro dashboardy a reporty.
Základy a syntax GROUP BYAgregační funkce COUNT a SUMAVG, MIN a MAX pro distribuceHAVING pro filtrování agregačních výsledkůSeskupování podle výrazů a intervalůZpracování NULL hodnot v agregacíchLekce 4Načítání CSV do databází: COPY, LOAD DATA, sqlite import a běžné pastiNaučte se praktické metody načítání CSV dat do databází pro analýzu. Používejte COPY, LOAD DATA a SQLite import, zpracovávejte oddělovače a kódování a vyhýbejte se běžným pastím způsobujícím špatná nebo částečná načtení.
Příprava CSV pro spolehlivý importPoužití COPY v PostgreSQL a podobných systémechLOAD DATA pro MySQL a kompatibilní enginySQLite .import workflow a možnostiZpracování kódování, oddělovačů a uvozovekValidace počtu řádků a odmítnutých záznamůLekce 5Základy DDL a DML: CREATE TABLE, ALTER, INSERT, UPDATE, DELETE, řízení transakcíNaučte se, jak DDL a DML tvarují a modifikují tabulky pro analýzu. Cvičte tvorbu a úpravu schémat, vkládání a aktualizaci dat, bezpečné mazání a použití transakcí pro zajištění integrity dat v analytických workflow a pipelinech.
Tvorba analytických tabulek pomocí CREATE TABLEBezpečné modifikace schémat pomocí ALTER TABLEVzorce INSERT pro hromadné a inkrementální načteníUPDATE a DELETE s bezpečnými predikátyCOMMIT, ROLLBACK a rozsah transakcíVlastnosti ACID v analytických úloháchLekce 6Základy dotazů: SELECT, WHERE, ORDER BY, LIMIT, DISTINCTOvladněte klíčovou syntax dotazů používanou v téměř každé analýze. Naučte se, jak SELECT získává sloupce, WHERE filtruje řádky, ORDER BY řadí výsledky, LIMIT ovládá velikost vzorku a DISTINCT odstraňuje duplicity v analytických dotazech.
Návrh seznamu SELECT a aliasy sloupcůFiltrování řádků podmínkami WHEREŘazení výsledků pomocí ORDER BYLIMIT a OFFSET pro vzorkování datPoužití DISTINCT pro odstranění duplicitZákladní ladění a vylepšování dotazůLekce 7Spoje a množinové operace: INNER, LEFT, RIGHT, FULL, CROSS, UNION, EXCEPT, INTERSECTPochopte, jak spoje a množinové operace kombinují datasety pro analýzu. Naučte se, kdy použít každý typ spoje, jak se vyhnout chybám duplikací a jak UNION, EXCEPT a INTERSECT podporují komplexní analytická porovnání.
INNER JOIN pro průsečíky datasetůPřípad použití LEFT, RIGHT a FULL OUTER JOINCROSS JOIN a kartézské součiny v analýzeUNION vs UNION ALL pro stohování datEXCEPT a INTERSECT pro porovnání množinDetekce a zpracování duplikací ve spojíchLekce 8Koncepty relačních databází: tabulky, primární/cizí klíče, normalizace vs denormalizacePochopte klíčové relační koncepty, které tvoří základ analytických schémat. Naučte se tabulky, primární a cizí klíče, formy normalizace a kdy denormalizovat pro výkon v reportingu a BI úlohách.
Tabulky, řádky a sloupce v praxiPrimární klíče a omezení jedinečnostiCizí klíče a referenční integritaFormy normalizace a kontrola redundanceDenormalizace pro výkon reportinguPřehled hvězdicových a vločkových schématLekce 9Základy výkonu: indexy, plány dotazů, explain/analyze, jednoduché strategie optimalizace pro analytické dotazyZískejte praktický pohled na výkon dotazů pro analýzu. Naučte se, jak indexy fungují, čtení plánů dotazů, použití EXPLAIN a ANALYZE a aplikaci jednoduchých strategií optimalizace pro udržení efektivity analytických dotazů.
Jak indexy zrychlují vyhledávání a spojeČtení a interpretace plánů dotazůPoužití EXPLAIN a ANALYZE v praxiIdentifikace pomalých filtrů a spojůOptimalizace GROUP BY a agregacíZákladní strategie indexování pro analýzuLekce 10Přehled window funkcí: ROW_NUMBER, RANK, DENSE_RANK, SUM() OVER(), AVG() OVER(), PARTITION BYProzkoumejte window funkce pro pokročilou analýzu bez kolapsu řádků. Naučte se ranking, běžící součty, klouzavé průměry a strategie partionování pohánějící analýzu kohort, trendů a segmentace v SQL.
Syntax window funkcí a klauzule OVERPřípad použití ROW_NUMBER, RANK a DENSE_RANKBěžící součty pomocí SUM() OVER()Klouzavé průměry s window rámyPARTITION BY pro logiku kohort a segmentůORDER BY ve window vs řazení dotazu