Polona, czyli B+R w praktyce

Polona, czyli B+R w praktyce

Opublikowany

4 lata i 13 milionów użytkowników - tak w skrócie można opisać Polonę – Cyfrową Bibliotekę Narodową. Projekt, który tworzyliśmy w ramach prac B+R, właśnie miał swoją drugą premierę. Bo „Polona/2 miliony” to nie tylko ponad 2 miliony obiektów dostępnych w serwisie, ale przede wszystkim nowe liczne technologiczne i UXowe rozwiązania.

Rozwiązanie nietuzinkowego  problemu, zbadanie możliwości wdrożenia eksperymentalnych rozwiązań, wdrożenie innowacji  – to główne cele projektów badawczo-rozwojowych. Punktem wyjścia do projektu B+R jest ustalenie celów biznesowych, problemów badawczych i kierunkowego przebiegu projektu  Dlatego tego typu projekty przyspieszają rozwój i zwiększają użyteczność wybranych przedsięwzięć
- mówi Bartosz Stodulski, współzałożyciel, CEO w Laboratorium EE i współtwórca Polony.
Kiedy pięć lat temu rozpoczynaliśmy prace badawczo-rozwojowe nad Cyfrową Biblioteką Narodową Polona, mieliśmy jeden cel – stworzenie najnowocześniejszej i najbardziej użytecznej aplikacji do obsługi cyfrowych zbiorów biblioteki. Jednocześnie zależało nam, żeby każdy, kto chce, mógł łatwo przeszukiwać jej zasoby. W wywiadzie dla Gazety Wyborczej Bartosz tłumaczył, co było punktem wyjścia dla projektowania Cyfrowej Biblioteki Narodowej:

Większość zagranicznych bibliotek, czasem mających niesamowite zbiory, była uboga technologicznie. W niektórych pojawiały się inspirujące możliwości, ale żadna nie miała aż tak nowoczesnego i rozbudowanego systemu. Służyły głównie specjalistom. Nam chodziło o odczarowanie biblioteki. Chcieliśmy, żeby nie była tylko jaskinią dla naukowców, ale stała się dobrem publicznym, którym zainteresuje się Kowalski.

wwwprojekty_polona1.pngwwwprojekty_polona3.pngwwwprojekty_polona20.pngwwwprojekty_polona2.png

Jak wyglądała realizacja projektu? Na początku zajęliśmy się analizą i pracami badawczymi, nad którymi spędziliśmy ponad pół roku. W tym czasie wyznaczyliśmy kierunek, w którym chcemy rozwijać projekt. Zaplanowaliśmy też prace miesiąc po miesiącu – np. określiliśmy, które funkcje Cyfrowej Biblioteki Narodowej muszą być dostępne od samego początku, a które mogą być dodane w późniejszych wersjach serwisu. Po stworzeniu wstępnych planów, zaczęliśmy myśleć nad wyglądem Polony, więc rozpoczęliśmy prace graficzne i z zakresu UX. Chcieliśmy, żeby Polona miała dużo przydatnych opcji, ale żeby jednocześnie była prosta w obsłudze dla użytkownika. Dlatego postawiliśmy na intuicyjność i przejrzystość. Podczas pracy nad projektem przed nami stanęło wiele wyzwań technologicznych i koncepcyjnych. Udało się im stawić czoła i stworzyć szereg rozwiązań. Większość z nich znalazła zastosowanie w najnowszej wersji Polony, więc cieszymy się podwójnie: z tego, że podczas prac udało nam się opracować pomysły, które można wykorzystać w innych tego typu projektach i z tego, że nasze rekomendacje w większości znaleźć można w Polonie 3.0.  A wdrożenie efektów prac B+R jest najlepszym potwierdzeniem skuteczności prowadzonych działań.

Od czego zacząć przygodę z milionem materiałów dostępnych w serwisie Polona?

Strona główna – to na jej podstawie decydujemy o tym, czy zostaniemy w serwisie na dłużej. Musi spełniać dwa warunki – pokazać możliwości serwisu i zachować prostą, nieskomplikowaną formę. Dlatego w zespole UXowym przed ostateczną wersją, opracowaliśmy kilkadziesiąt makiet, które posłużyły do stworzenia dużych kafli w wersji premierowej Polony.

Wraz z rozwojem serwisu, wzbogacaniem o nowe funkcje, ale też obserwacją zachowań użytkowników, Polona w wersji 3.0 została wizualnie przeprojektowana. Nasz projekt – w wersji już wdrożonej, zaprojektowanej graficznie przez studio Huncwot – można dziś oglądać w najnowszej odsłonie serwisu.


Zrzut ekranu 2017-10-18 o 00.09.10.png

Praca z obiektem, czyli jak zachęcić użytkownika do zabawy z publikacjami?

Polona służy nie tylko oglądaniu obrazów czy rękopisów – to narzędzie do codziennej pracy dla naukowców, studentów czy pasjonatów. Dlatego jednym z wyzwań podczas pracy było stworzenie całej ścieżki użytkownika, czyli określenie, w jaki sposób będzie mógł korzystać z wybranego materiału.

Polona 2 000 000 | praca na obiekcie | zoom | logowanie

W praktyce, nasz projekt pozwala m.in. na dodawanie notatek (np. do konkretnych fragmentów książki), pinezek czy zakładek, które ułatwią pracę zalogowanym użytkownikom.

Jak wyświetlać kilku-, a czasem kilkudziesięciogigabajtowe obrazy w płynny sposób?

Pierwsze, a zarazem jedno z najważniejszych wyzwań dotyczyło technologii wyświetlania cyfrowych zasobów. Niektóre książki, obrazy czy rękopisy są skanowane w bardzo wysokiej rozdzielczości. Z jednej strony to dobrze, bo skany najwyższej jakości pozwalają dostrzec na nich nawet najmniejsze detale. Jednocześnie jednak pliki są bardzo duże, a ich wczytywanie może zająć dużo czasu – szczególnie na wolniejszym łączu. Dlatego szukaliśmy rozwiązań, które pozwolą przeglądać materiały w wygodny i szybki sposób. Technologia Seadragon Microsoftu, która pozwala na optymalizację grafik stała się dla nas podstawą do eksperymentów. Ich efektem była rekomendacja w postaci technologii Malakh.js, opracowanej przez nasz zespół prowadzony przez Michała Gołębiowskiego-Owczarka udostępnionej opensource'owo. Umożliwia dynamiczne przeglądanie skanów i szybkie ich przybliżanie bez konieczności długiego czekania na załadowanie obrazu. Technologią Malakh.js zainteresowali się nawet programiści ze Stanford University – po opublikowaniu rekomendacji i kodu skontaktowali się z nami, żeby dowiedzieć się, jak działają jego poszczególne funkcje – m.in. wyświetlanie wielu obrazów jednocześnie.

Zrzut ekranu 2017-10-18 o 00.12.05.png

Więcej o technologii Malakh: https://laboratorium.ee/projekty/polona-technologia-malakh/

Jak sprawić, żeby z Polony korzystało możliwie najwięcej osób?

Polona opiera się na milionowych zbiorach Biblioteki Narodowej udostępnionych na zasadzie otwartej licencji. Każdy znajdzie tu coś dla siebie – pasjonaci kartografii mogą przeglądać archiwalne plany Warszawy sprzed kilkuset lat, fani Witkacego mogą obejrzeć jego rękopisy i szkice, a ci, którzy interesują się dawnymi wydaniami prasy lokalnej, mogą przeszukiwać zbiory sprzed kilkudziesięciu lat. Zależało nam, żeby jak najwięcej osób dowiedziało się o istnieniu Polony i żeby zbiory były wykorzystywane przez możliwie najwięcej osób. Przygotowaliśmy rozwiązanie, dzięki któremu każdy, kto posługuje się językiem kodowania otrzymałby możliwość tworzenia własnych opracowań, stron www czy aplikacji z wykorzystaniem zdigitalizowanych zbiorów BN. Nie musi nic pobierać ani odtwarzać – wystarczy, że wykorzystałby to, co już powstało. Przykładem wykorzystania Polona API jest narzędzie Polona Typo. API „Polony” jest ogólnodostępne i miało swoją premierę podczas Hackathonu danych publicznych.

Jak efektywnie przeszukiwać zbiory Cyfrowej Biblioteki Narodowej?

Wśród zaproponowanych przez nas rozwiązań dla Polony znalazł się też mechanizm podpowiedzi, który pozwala użytkownikowi szybciej dotrzeć do tego, czego szuka. Jego częścią był również mechanizm z dynamicznymi filtrami i obsługą końcówek fleksyjnych. Dzięki niemu, obojętnie, czy użytkownik wpisze frazę „Mickiewicz” czy „Mickiewicza”, wyświetlić powinny mu się takie same wyniki. Mechanizm nie znalazł się jednak w ostatecznej, najnowszej wersji Polony. Po premierze pierwszej wersji okazało się za to, że użytkownicy chętnie wyszukiwaliby hasła oparte o treść, a nie tylko tytuł, autora itp. Dlatego opracowaliśmy i zarekomendowaliśmy rozwiązanie, które dzięki pracy Biblioteki Narodowej i zastosowaniu OCR, pozwala wyszukiwać hasła np. w tekście widocznym na obiektach, które pojawiło się w nowszej wersji serwisu.

Polona 2 000 000 | filtry | wyszukiwarka prosta | wyszukiwarka zaawansowana

Polona/2 miliony to także możliwość szukania po czasopismach. Opracowaliśmy koncepcję wyszukiwarki, na którą składa się osobny interfejs, który umożliwia wygodną nawigację po rocznikach za pomocą osi czasu.

Polona 2 000 000 | czasopisma | wyszukiwanie | metadane

Pierwszy etap prac badawczo-rozwojowych (B+R) to ponad 400 dni pracy i 2 miliony zeskanowanych książek, obrazów, tekstów, czasopism i innych źródeł. W czerwcu 2013 r. serwis Polona.pl stał się ogólnodostępny, a do dziś odwiedził go co czwarty Polak. Jako Laboratorium EE zakończyliśmy projekt B+R w 2015 roku. Jego końcowym produktem były nowoczesne rozwiązania i rekomendacje – m.in. opisany powyżej Malakh, czy ogólnodostępne API.


Po trzech latach od premiery Polona to serwis, który nie tylko cieszy się niesłabnącą popularnością, ale i stale się rozwija. Liczba użytkowników, zgromadzonych dzieł i przybywających funkcji tylko potwierdza, że B+R naprawdę sprawdza się w praktyce.
Jak obecnie wygląda? Co się zmieniło? Najlepiej sprawdzić samemu na https://polona.pl

Wykonawcy Polona 3.0:
Prace programistyczno-konfiguracyjne: Laboratorium EE, Bitnoise i Neubloc Polska Sp. z o.o.
Wdrożenie: Neubloc Polska Sp. z o.o.
Grafika: Huncwot

Cytat zamieszczony w tekście pochodzi z opublikowanego w Gazecie Wyborczej wywiadu Anny S. Dębowskiej z Bartoszem Stodulskim.

Informacja nt. liczby użytkowników pochodzi z konferencji inaugurującej Polona/2miliony: https://www.youtube.com/watch?v=ipYe3hOvmzQ&list=PL1cZLR6eXKrfQg5lAFnpinqk7u1nGWcPi&index=8

Udostępnij

Flaszki EE - Zły UX w urzędzie i... ptaki / 20.10.2017

1. Jarosław Dobrowolski - O złym UX
. 2. Marta Czarnocka-Cieciura - O obrączkowaniu ptaków (od 13:30)