If-Koubou

Jak eksportować swoje elementy oznaczone gwiazdką z Czytnika Google

Jak eksportować swoje elementy oznaczone gwiazdką z Czytnika Google (Jak)

Jeśli Twoja reakcja na ogłoszenie o śmierci Google Reader brzmiałaby "Ale moje ulubione przedmioty! ", To jest tutorial dla ciebie. Czytaj dalej, ponieważ pokazujemy różne sposoby wyodrębniania wszystkich artykułów oznaczonych gwiazdką z Czytnika Google.

Dlaczego chcę to zrobić?

Czytnik Google wyłącza się 1 lipca. Jeśli ty, podobnie jak miliony fanów RSS na całym świecie, jesteś fanem Czytnika Google, istnieje duża szansa, że ​​użyłeś funkcji gwiazdy do oznaczania artykułów do przetrzymywania, czytania później lub do jakiegoś innego celu.

Jeśli chcesz mieć pewność, że wszystkie te artykuły oznaczone gwiazdką są bezpieczne i bezpieczne, mimo zbliżającej się implozji Google Reader, musisz wykonać kilka drobnych czynności, aby upewnić się, że masz dane w posiadaniu i nie zostawiasz ich do zgniotu. Serwery Google.

Po zakończeniu samouczka będziesz mieć (przynajmniej) plik, który zawiera wszystkie elementy oznaczone gwiazdką oraz (w zależności od tego, z którego segmentu samouczka zdecydujesz się podążać) elementy oznaczone gwiazdką w większej liczbie użytkowników przyjazny format.

Jest jednak jedna rzecz, z której nie może skorzystać żaden magia wywozu lub automatyzacji, a to faktycznie przetwarza treść artykułów oznaczonych gwiazdkami. Jeśli publikujesz artykuły, które będą czytać później przez lata, prawdopodobnie zdziwisz się, ile wyeksportowanych artykułów generuje ten proces. Być może będziesz musiał odłożyć na bok trochę czasu każdego dnia na kilka tygodni, aby przeglądać wynikowy zrzut bit po bicie.

Eksportowanie danych Google Reader z Google Takeout

Najpierw należy zamówić kopię wszystkich danych z Czytnika Google bezpośrednio w posiadaniu. W ten sposób, bez względu na to, co stanie się z Twoimi danymi z Czytnika na serwerach Google w przyszłości, będziesz mieć kopię do pracy.

Google Takeout to świetne narzędzie do wydobywania danych ze wszystkich usług Google, ale interesuje nas tylko Czytnik dla tego samouczka. Odwiedź podsekcję Czytnik narzędzia Google Takeout tutaj. Obliczenie rozmiaru pliku Takeout zajmie chwilę. Po zakończeniu kliknij Utwórz archiwum.

Mimo że nie eksportuje całego konta Google, ale tylko niewielką jego część, proces ten zajmuje zaskakująco dużo czasu. Zalecamy sprawdzenie opcji "Wyślij do mnie e-maila, gdy wszystko będzie gotowe" i zabranie filiżanki kawy.

Kiedy wszystko się skończy, kliknij przycisk Pobierz, który pojawi się w prawym dolnym rogu.

Śmiało i wyodrębnij archiwum do katalogu roboczego, takiego jak Moje dokumenty, i umieść archiwum w bezpiecznym miejscu. Pliki archiwum są uporządkowane w następujący sposób:

[email protected].
... [email protected]
... Czytelnik
... followers.json
... follow.json
... lubi.json
... notes.json
... shared-by-followers.json
... shared.json
... starred.json
... subscriptions.xml

W archiwum są dwa typy plików: JSON i XML. Pliki JSON (JavaScript Object Notation) są po prostu typem formatu wymiany danych, a pliki XML (Extensible Markup Language) są poręcznym sposobem oznaczania dokumentu, dzięki czemu jest on zarówno czytelny dla komputera, jak i dla człowieka. Plik, który najbardziej nas interesuje w tym samouczku, to plik starred.json, ponieważ zawiera wszystkie wpisy dotyczące elementów oznaczonych gwiazdką.

Równie ważne w wielkim schemacie uwalniania danych z Czytnika Google i przechodzenia na bardziej zielone pastwiska jest jednak plik subscriptions.xml. Ten plik zawiera wszystkie twoje subskrypcje RSS i, jeśli chcesz importować wszystkie stare subskrypcje z Czytnika Google do nowej aplikacji RSS, jest to plik, którego będziesz używał. Zdecydowanie przechowuj go (i oryginalne archiwum pobrane z Google Takeout) w bezpiecznym miejscu.

Konwertowanie elementów oznaczonych gwiazdką na zakładki

Jednym z najprostszych sposobów radzenia sobie z plikiem JSON jest użycie JSONview (rozszerzenia dostępnego zarówno dla przeglądarki Firefox, jak i Chrome). Ta metoda najlepiej nadaje się dla czytelników, którzy mają niewielką liczbę elementów oznaczonych gwiazdką w Czytniku Google (mniej niż 1000).

Zainstaluj rozszerzenie dla swojej przeglądarki, a następnie przeciągnij i upuść plik starred.json na nowe okienko przeglądarki. Zapisz wynikowy plik jako dokument HTML. Następnie możesz skręcić w prawo i zaimportować dokument HTML do wybranej przeglądarki internetowej, która zaimportuje wszystkie linki jako nowe zakładki.

Istnieją jednak dwa wady tej techniki. Po pierwsze, w pliku zakładek pojawią się zduplikowane adresy URL, ponieważ adres URL głównej domeny / głównego artykułów często oznaczonych gwiazdką (np. Powiedz, artykuły z How-To Geek) pojawi się kilka razy. To trochę denerwujące, ale nie takie duże.

Drugą wadą jest łamacz transakcji dla osób z wieloma gwiazdkami (te z nas z tysiącami pozycji oznaczonych gwiazdką); kiedy mamy do czynienia z naprawdę ogromnym importem HTML, w większości przypadków po prostu się psuje i nigdy się nie kończy. Oczywiście jest to wysoce niezadowalające rozwiązanie dla zaawansowanych użytkowników programu Reader, ponieważ nigdy nie kończy importowania elementów oznaczonych gwiazdką. Jeśli jesteś zaawansowanym użytkownikiem i masz do dyspozycji tysiące przedmiotów z gwiazdkami, importowanie ich jako zakładki po prostu go nie przerwie.

Konwertowanie elementów oznaczonych gwiazdką na pojedyncze linki (i importowanie do Evernote)

Jeśli chodzi o rodzaj zaawansowanej mocy obliczeniowej, jakiej potrzebują użytkownicy (rodzaj przetwarzania, dzięki któremu w ciągu kilku minut można przetworzyć ponad 5000 elementów oznaczonych gwiazdką), zwracamy się do Pythona, aby pomóc nam przejrzeć naszą ogromną listę.

Dzięki uprzejmości Paula Kerchena i Davide Della Casa, dwóch potężnych czytelników Google Reader, którzy chcieli wyeksportować wszystkie swoje stare pozycje oznaczone gwiazdką, mamy dwa przydatne skrypty w języku Python, które mogą nam pomóc w jednej z dwóch rzeczy: 1) przekonwertować wszystkie pozycje oznaczone gwiazdką na różne dokumenty HTML i / lub 2) importować wszystkie nasze oznaczone gwiazdkami elementy do Evernote.

W przypadku obu lew, musisz mieć zainstalowany Python w systemie. Chwyć kopię Pythona dla swojego systemu operacyjnego i zainstaluj go przed kontynuowaniem.

Po zainstalowaniu Pythona odwiedź stronę projektu eksportu Czytnika Google Kerchen / Casa i zapisz pliki export2HTMLFiles.py oraz export2enex.py w tym samym folderze, do którego wyodrębniono plik starred.json.

Aby przekonwertować wszystkie elementy oznaczone gwiazdką na odrębne pliki HTML, można to zrobić za pomocą pliku export2HTMLFiles.py, wykonując następujące polecenie w katalogu, w którym przechowywany jest plik starred.json:

python export2HTMLFiles.py

(Jeśli python nie jest oznaczony jako ogólnosystemowe polecenie na twoim komputerze, zastąp "python" pełną ścieżką do pliku wykonywalnego Pythona, np. C: \ Python2.7 \ python.exe)

W zależności od liczby oznaczonych gwiazdkami elementów proces ten może trwać od kilku sekund do kilku minut. Potrwało to około trzech minut, aby przebić 12 000 oznaczonych gwiazdkami przedmiotów podczas naszego testu.

Gdy to się stanie, będziesz mieć serię ponumerowanych i nazwanych plików HTML (np. 1 artykuł, który zagrałeś.html do 10000 jakiegoś innego artykułu, w którym zaznaczyłeś gwiazdkę.html). Najprostszym sposobem na obejrzenie ich wszystkich jest po prostu załadowanie lokalnego katalogu w przeglądarce.

To świetny sposób na uwolnienie elementów oznaczonych gwiazdką z Czytnika Google i pliku JSON, ale jak wspomnieliśmy wcześniej w samouczku, jeśli zapisywałeś artykuły i czytasz je później przez lata, będziesz miał monumentalne zadanie Twoje ręce.

Jednym ze sposobów lepszego zarządzania tym zadaniem jest wykorzystanie Evernote jako obszaru roboczego do sortowania, oznaczania i potencjalnego usuwania nieużytecznych elementów oznaczonych gwiazdką.

Istnieją dwa sposoby importowania elementów do Evernote. Możesz zaimportować pliki HTML, które stworzyliśmy przed chwilą, używając folderu importu. W twoim kliencie desktop Evernote możesz przejść do Narzędzia -> Importuj foldery, a następnie utwórz folder zrzutu dla plików HTML. Zrobiliśmy podfolder w folderze / Reader / work o nazwie Imports i nowy notes w Evernote o nazwie Elementy oznaczone gwiazdką. Przeciągając i upuszczając pliki HTML do folderu / Reader / Imports / jesteśmy w stanie zaimportować je jako odrębne notatki do folderu Elementy oznaczone gwiazdką Evernote. Są tam na stałe przechowywane, aby można je było przejrzeć w wolnym czasie.

Jeśli chcesz za jednym zamachem konwertować wszystkie elementy oznaczone gwiazdką do natywnego notesu Evernote, możesz użyć drugiego skanu Pythona, który pobrałeś, export2enex.py, aby to zrobić. Zaletą tego jest to, że wykonuje nieco lepszą pracę zachowując formatowanie dokumentów.

W folderze, w którym znajduje się plik starred.json, wykonaj następujące polecenie:

python export2enex.py> StarredImport.enex

Pobierz plik wynikowy StarredImport.enex i zaimportuj go do swojego klienta Evernote na pulpicie przy użyciu Plik -> Importuj -> Eksportuj pliki Evernote.

W tym momencie udało Ci się całkowicie uwolnić elementy oznaczone gwiazdką od Czytnika Google i możesz przejść do (potencjalnie długiego) biznesu sortowania stosu.

Czy masz sprytny sposób na manipulowanie plikiem JSON i wyodrębnianie elementów oznaczonych gwiazdką? Dołącz do poniższej dyskusji i dziel się swoimi wskazówkami i sztuczkami z innymi czytelnikami.