Hacknight
18 kwietnia 2016
PDF to format plików szeroko stosowany m.in. przez administrację publiczną do prezentacji wszelkiego typu dokumentów. Czasem istnieje jednak potrzeba maszynowej analizy danych zawartych w plikach PDF, co jest trudne zwłaszcza w przypadku tabel osadzanych dokumentach. Podczas hacknightu Porozumienie Fundament Społeczeństwa Informacyjnego zaprezentuje narzędzia (firm trzecich oraz własne) do ekstrakcji danych tabelarycznych z plików PDF obrazujących strukturę polskiego budżetu narodowego. Dzięki nim ekonomiści naszego Instytutu mogli opracować dane publiczne tak, aby pokazać je w sposób przystępny dla obywateli. Efekt – aplikacja “Jak wydawane są moje podatki”.