www.slu.cz WEB SCRAPING Radim Dolák Workshop na téma Web scraping 18.02.2025 Efektivní extrakce dat z webu WEB SCRAPING – DEFINICE POJMU vWeb scraping (čti jako „web skrejping“) je technika automatického získávání, třídění a využívání dat z webových stránek pomocí specializovaných nástrojů. vTato data se následně ukládají do souborů ve formátech jako XLS, CSV nebo JSON. vCílem web scrapingu je především úspora času a rychlé získávaní informací. SLEZSKÁ UNIVERZITA WEB SCRAPING – VÝHODY vRychlost a efektivita – sběr velkého množství dat z různých webů vyžaduje trpělivost a spoustu práce, ale díky automatizaci se tento proces mnohonásobně zjednodušil. vVšestrannost – web scraping lze využít v různých odvětvích a pro různé účely. Například e-shopy jej zužitkují k porovnávání cen a sledování dostupnosti produktů. Marketingové firmy pak mohou snadno shromažďovat a studovat data o chování uživatelů. vWeb scraping je legální – musí se však provádět s respektem k soukromí uživatelů i autorským právům. Lidé pracující na web scrapingu by tak měli ideálně dodržovat veškeré i etické zásady. SLEZSKÁ UNIVERZITA WEB SCRAPING – NÁSTROJE vAPIFY (apify.com) vBROWSE.AI (https://www.browse.ai) vOUTSCRAPER (https://outscraper.com) SLEZSKÁ UNIVERZITA SLEZSKÁ UNIVERZITA SLEZSKÁ UNIVERZITA SLEZSKÁ UNIVERZITA WEB SCRAPING – POUŽITÉ ZDROJE https://coderslab.cz/cz/blog/co-je-webscraping SLEZSKÁ UNIVERZITA www.slu.cz DĚKUJI ZA POZORNOST