Do operatorów botów: Prosimy nie wprowadzać zmian kosmetycznych (niemających znaczenia funkcjonalnego bądź merytorycznego), jeśli nie są wprowadzane przy okazji innych zmian. Wszelkie zmiany na dużą skalę, które mają objąć 500 artykułów i więcej, prosimy konsultować z co najmniej jednym operatorem bota.
Nie wpisuj zadania do kilku miejsc. Jeśli wpisałeś je do dyskusji operatora bota, to nie dodawaj go tutaj, i odwrotnie. Inaczej ludzie będą marnować czas, pracując nad tym samym.
znalezieniu artykułów z szablonem {{Encyklopedia PWN}}, w którym pole "tytuł" jest tożsame z tytułem artykułu (ewentualnie z pominięciem ujednoznacznienia w nawiasie dla haseł typu "Tytuł (ujednoznacznienie)")
pobraniu identyfikatora i wpisaniu go jako właściwości P7305 w WD
Tożsamość tytułów nie jest dobrym kryterium, gdyż EPWN często zmienia kolejność członów (np. Adolf Horubała vs Horubała Adolf). Przygotowałem listę 7270 wystąpień, które trzeba przejrzeć ręcznie. Jeśli nie znajdę czasu, to może mi to zająć parę tygodni. Szablon ma w sumie prawie 11k wywołań, czyli istnieje dużo wystąpień spoza listy: wielokrotne wywołania na stronie oraz dublujące się identyfikatory EPWN. Te przypadki można uwzględnić po przerobieniu obecnej listy. Peter Bowman (dyskusja) 15:40, 27 sie 2021 (CEST)[odpowiedz]
Każdy algorytm wyszukiwania będzie podatny na wyjątki, i wcale nie będzie przy tym mniej pracy. Najprościej przejrzeć każdy element pojedynczo, ale z odrobiną umiejętności można to wykonać w miarę sprawnie. Jeżeli napotkam takie nieskomplikowane mapowanie na liście, to faktycznie mogę spokojnie iść do następnego, bo z dużym prawdopodobieństwem chodzi o tę samą osobę lub byt. Dla przypadków budzących wątpliwości wykombinowałem sobie taki skrypt, który generuje dymek po najechaniu kursorem na link zewnętrzny EPWN, zawierający strzeszczenie z tamtejszej definicji. To plus włączone dymki dla podglądu haseł w Wikipedii powinno znacznie usprawnić proces weryfikacji. Na razie proszę nie traktować tej listy jako ostateczną, bo chyba ją jeszcze uzupełnię o wspomniane duplikaty. Peter Bowman (dyskusja) 22:17, 29 sie 2021 (CEST)[odpowiedz]
Może biogramy byłoby łatwej namierzyć. Generalnie w nich jest data i miejsce urodzin oraz śmierci. Można to wykorzystać w celu automatycznej weryfikacji zgodności. Pozostałe trzeba będzie chyba przeglądać ręcznie. Pokusiłbym się nawet o próbę skanowania bazy PWN w celu wyszukiwania biogramów. Jednak nie wiem czy to nie grozi banem. Może lepiej zrobić pospolite ruszenie i przynajmniej spróbować ustalić ręcznie taki link przynajmniej dla artykułów wyróżnionych. Paweł Ziemian (dyskusja) 14:35, 28 sie 2021 (CEST)[odpowiedz]
Jakby co to mam prawie przygotowaną listę około 20k par biogramów z Q i EPWN. Oczywiście to tylko wynik automatu, ale wstępny przegląd losowych próbek wykazuje, że wartości do siebie pasują. Niestety nie potrafię określić poziomu ufności tak przygotowanych danych. Na mojej liście są tylko artykuły, które mają już wstawiony szablon {{kontrola autorytatywna}}. Paweł Ziemian (dyskusja) 09:05, 19 wrz 2021 (CEST)[odpowiedz]