Wikipedia:Sarcini pentru roboți

De la Wikipedia, enciclopedia liberă
(Redirecționat de la Wikipedia:SR)
Sari la navigare Sari la căutare
Comandă rapidă:
WP:SR


Aceasta este o pagină în care puteți trimite cereri pentru a fi realizate de către un robot. Acesta este locul în care puteți adăuga idei pe care apoi roboții să le materializeze. Tot aici trebuie adăugate sarcinile pe care doriți să le realizați folosind un cont care are deja flagul de robot.

Dacă nimeni nu exprimă vreo observație asupra unei cereri într-o săptămână de la depunere, se consideră că cererea respectivă poate fi implementată. în caz contrar, trebuie să se ajungă la consens în privința cererii inainte de rularea robotului.

Vă rugăm adăugați cererea dumneavoastră la sfârșitul paginii.

Dacă sunteți operator de robot și finalizați o cerere, vă rugăm să o arhivați. Cererile care nu mai sunt relevante trebuie arhivate după un timp.

Arhiva cererilor realizate:

Adăugați o nouă cerere

Sarcini permanente[modificare sursă]

Mai jos sunt trecute cererile care trebuie rulate regulat dar nu au fost preluate încă de niciun operator de robot.

Pagini cu legături invalide către fișiere[modificare sursă]

S-au adunat multe pagini în Categorie:Pagini cu legături invalide către fișiere. Era mai demult un robot care le scotea, însă nu mai rulează.— Ionutzmovie discută 23 august 2016 19:05 (EEST)[răspunde]

Am realizat operațiunea manual, însă mai apar câteva pagini. Cred că nu mi le-a afișat pe toate în categorie atunci când am terminat curățarea ei, iar o altă parte din articole au categoria pentru că cei de la Commons par să nu ruleze întotdeauna CommonsDelinker.— Ionutzmovie discută 29 ianuarie 2017 07:10 (EET)[răspunde]

Link-uri moarte[modificare sursă]

Nu știu dacă e zona potrivită pentru o astfel de cerere și nici dacă e realizabil, neavând cunoștințe în acest domeniu. Am văzut că la en.wiki există un robot care înlocuiește automat link-urile moarte cu altele către versiunile arhivate ale site-urilor (Web Archive, Archive.is etc.). Ar fi de mare ajutor și nouă un astfel de robot.--Kunok Kipcsak (discuție) 26 aprilie 2019 22:24 (EEST)[răspunde]

Pagini de dezambiguizare pentru comune[modificare sursă]

Ar trebui făcute redirectări pentru pagini de dezambiguizare pentru comune.

De exemplu pagina Comuna Brăești ar trebui să redireceze către pagina Brăești, pentru că există următoarele comune:

 Ark25  (discuție) 3 decembrie 2016 20:12 (EET)[răspunde]

O am în backlog demult. Pentru cele din România se pot face relativ rapid. —Andreidiscuție 4 decembrie 2016 09:23 (EET)[răspunde]

M-am uitat un pic pe situația existentă pentru comunele din România (rezumat aici) și văd mai multe probleme:

  1. Sunt cel puțin 3 țări de care trebuie ținut cont: România, Republica Moldova și Ucraina. Nu m-ar mira să mai fie și în Ungaria și Serbia câte ceva.
  2. Există mai multe situații curente:
    1. Redirecționare spre o pagină generică de redirecționare
    2. Redirecționare spre o pagină de redirecționare specifică pentru comune
    3. Redirecționare spre un articol (pe astea le-am șters la grămadă pentru a face loc unor redirecționări corecte când decidem cum facem)
  3. Paginile de dezambiguizare generice amintesc doar de sat, nu și de comună (formularea standard e X, Jud. este satul de reședință al comunei cu același nume, dar nu toate o folosesc)

Având în vedere cele de mai sus, redirecționarea către paginile generice pare cea mai simplă soluție, dar nu neapărat cea mai bună. Poate ar merita investit în separarea paginilor de dezambiguizare pentru comune/sate/altele? Suplimentar (sau alternativ) ar trebui uniformizate și numele paginilor generice de dezambiguizare.--Strainu (دسستي‎)  3 iunie 2019 00:15 (EEST)[răspunde]

Localități[modificare sursă]

Se mai ocupă cineva cu crearea de articole despre localitățile lumii? Am sperat că munca lăudabilă depusă de Andrei Stroe la așezările din Ucraina va fi continuată de alți posesori de roboți, dar constat că s-a oprit. Crearea manuală de articole despre localități este greoaie și neproductivă. Măcar unul sau două state pe an și tot ar fi un progres. --Haptokar (discuție) 20 august 2017 13:45 (EEST)[răspunde]

Eu m-am oprit o vreme pentru că oricum e necesară o schimbare de paradigmă în lumina apariției proiectului Wikidata. —Andreidiscuție 21 august 2017 10:19 (EEST)[răspunde]
Înțeleg. Necesitatea creării articolelor rămâne totuși. --Haptokar (discuție) 21 august 2017 10:41 (EEST)[răspunde]

Dacă va fi reluat acest plan, aș vrea ca articolul-model să nu mai conțină {{ill}} și prietenii. E inutil să creăm zeci de mii de formate care să devină inutilă cu un simplu ciot. Mai bine îl creăm de la început și folosim legături interne.--Strainu (دسستي‎)  30 noiembrie 2018 12:39 (EET)[răspunde]

Obiecte NGC[modificare sursă]

Bună ziua! Se poate atribui unui robot sarcina de crea articole despre obiecte NGC (ex: NGC 96, NGC 104, NGC 129) sau crea unul nou pentru această sarcină? Mulțumesc! --FonAfon (discuție) 6 iulie 2019 12:25 (EEST)[răspunde]

A trecut deja o lună de când am întrebat... --FonAfon (discuție) 10 august 2019 00:27 (EEST)[răspunde]
S-ar putea să ajute Andrei cu asta. -- Alex Nico  (mesaj) 10 august 2019 00:30 (EEST)[răspunde]
@Alex Nico: Bine. Mulțumesc. --FonAfon (discuție) 10 august 2019 00:54 (EEST)[răspunde]
Vă referiți la Andrebot sau la Andrei Stroe? --FonAfon (discuție) 10 august 2019 00:57 (EEST)[răspunde]
La Andrei Stroe, robotul este operat de acesta. V-aș ajuta eu cu sarcina respectivă, doar că încă nu am învățat (încă) cum să operez un bot.-- Alex Nico  (mesaj) 10 august 2019 01:07 (EEST)[răspunde]
Sunt cereri deschise care așteaptă de 3 ani, iar arhivele sunt pline de cereri nerealizate. :) Nu e nimic personal, pur și simplu timpul e limitat pentru toată lumea. Problema exemplelor pe care le-ai dat e că nu arată toate la fel - roboții au nevoie de un articol standard.
Ce poți să faci este să îti construiești un format de articol, cu parametri, și apoi să-ti faci un tabel cu parametrii pentru fiecare corp în parte, din care să-ti construiești apoi wikitextul pentru fiecare articol. Pentru asta va trebui să înveti să creezi un format de la 0, să folosești expresii, apoi să faci 2-3 articole pe baza lui, să aștepți feedback de la comunitate și de-abia apoi să faci toată seria. Chiar și atunci vei mai avea de lucru (categorii suplimentare de creat sau de adaugat, articole cu alte nume decât te așteptai tu, poate dezacorduri etc.) Nu e ușor și cel mai probabil rezultatul nu ar fi perfect, dar probabil ai căpăta o viteză mai mare și poate ai putea folosi o unealtă precum AWB pentru a crea articole.
De exemplu, pare că ți-ar trebui cel puțin parametrii număr, alte_nume, tip, gen_tip, constelație, descoperitor, data_descoperirii. Dacă ai avea formatul {{articol NGC}}, pentru a începe articolul NGC 96 ai avea textul acesta undeva și l-ai copia direct în articol: {{subst:articol NGC|număr=96|alte_nume=|tip=galaxie lenticulară|gen_tip=feminin|constelație=Andromeda|descoperitor=Guilaume Bigourdan|data_descoperirii=1884-10-24}}.--Strainu (دسستي‎)  10 august 2019 01:10 (EEST)[răspunde]
@Strainu: Mulțumesc. Nu cred că este nevoie de un robot pentru asta. Voi încerca să creez formatul potrivit pentru articolele despre NGC. --FonAfon (discuție) 10 august 2019 03:33 (EEST)[răspunde]
Nu cred că are sens să creez un format pentru acest tip de articole. Mă descurc și fără. --FonAfon (discuție) 10 august 2019 13:56 (EEST)[răspunde]

Comunele Franței - infocasete[modificare sursă]

La foarte multe dintre comunele Franței (de exemplu, [1]), în infocasetetă se folosesc punctul pentru a separa fracțiile de întreg, respectiv virgula pentru a separa mii de sute (practic, importat din limba engleză). Acest mod de scriere poate induce confuzii cititorului român. --Bonnaventura (discuție) 2 august 2019 17:34 (EEST)[răspunde]

Andrei Stroe, sună a ceva ce Andrebot știe deja să facă (scoaterea informațiilor existente la Wikidata).--Strainu (دسستي‎)  4 august 2019 21:11 (EEST)[răspunde]
Da, am toate instrumentele și niște cod de la care aș putea porni. —Andreidiscuție 5 august 2019 12:11 (EEST)[răspunde]

Redirecționări î.e.n. -> î.Hr.[modificare sursă]

A existat o discuție la Cafenea, deschisă, ce-i drept, într-o cheie neproductivă și cu ceva trolling, dar din care a rezultat că ar fi foarte OK dacă am avea, pentru toți anii dinaintea erei noastre la care avem articole sufixate cu î.Hr., redirecționări de la titlul cu î.e.n.. Se poate face foarte simplu, este un task rapid pentru cine vrea să învețe să scrie roboți sau (presupun) să folosească AWB. Pot să-l fac și eu, dar prefer să dedic puținul timp pe care îl am la dispoziție operării și dezvoltării unor roboți care fac lucruri mai complicate. Dacă nu se găsește nimeni, voi face, probabil, eu asta, dar am zis să dau ocazia. —Andreidiscuție 5 august 2019 12:15 (EEST)[răspunde]

@Andrei Stroe: Are sens să ne ocupăm și de categorii? Bănuiesc că nu. Mai ales că sunt cam multe. //  Gikü  vorbe  fapte  13 noiembrie 2019 15:54 (EET)[răspunde]
Rezolvat Rezolvat pentru articole – vezi lista completă de redirecturi create. //  Gikü  vorbe  fapte  13 noiembrie 2019 17:45 (EET)[răspunde]

NGC[modificare sursă]

Bună ziua! În articolele despre obiecte NGC, se pot/poate:

  1. Adăuga legături interne către cataloage ([2]);
  2. Adăuga {{Portal bar|Astronomie|Galaxii}} în subsolul articolelor? Mulțumesc! --FonAfon (discuție | contribuții) 12 noiembrie 2019 15:03 (EET)[răspunde]
Respectiv {{Portal bar|Astronomie|Stea}}, în funcție de subiectul articolului. --FonAfon (discuție | contribuții) 12 noiembrie 2019 15:50 (EET)[răspunde]
Sunt contra adăugării de legături interne în titlu (ăla din introducere) și în header-ul infocasetei. Legătură la New General Catalogue avem în subsolul paginii. Cu restul sunt de acord. //  Gikü  vorbe  fapte  12 noiembrie 2019 15:56 (EET)[răspunde]
Ok. --FonAfon (discuție | contribuții) 13 noiembrie 2019 15:30 (EET)[răspunde]
+Mutarea formatului ciot deasupra casetelor NGC și a barei cu portale. --FonAfon (discuție | contribuții) 23 ianuarie 2020 19:03 (EET)[răspunde]

NGC 54, cum deosebește robotul stelele de galaxii?--Strainu (دسستي‎)  26 ianuarie 2020 15:06 (EET)[răspunde]

@Strainu: Dacă introducerea este „este o stea”, „este un roi deschis”, „este o nebuloasă de emisie”, „este o nebuloasă de emisie și un roi deschis”, „este un roi globular”, atunci se poate adăuga „{{Portal bar|Astronomie|Stea}}”. Dacă introducerea este „este o galaxie spirală”, „este o galaxie spirală barată”, „este o galaxie lenticulară”, „este o galaxie eliptică”, „este o galaxie”, „este o interacțiune de galaxii”, se poate adăuga „{{Portal bar|Astronomie|Galaxii}}”. --FonAfon (discuție | contribuții) 26 ianuarie 2020 15:23 (EET)[răspunde]

Categorie ani[modificare sursă]

Ar putea cineva să facă un robot care sa ia toate categoriile de genul Categorie:1949 și să înlocuiască conținutul cu:

{{Commonscat|1949}}

{{tl|catmain|1949} {{ancat}} {{Decadă categorie antet|decadă=1940}}

Categorie:Anii 1940 Categorie:Ani

Pentru Categorie:1948 trebuie înlocuit cu:

{{Commonscat|1948}}

{{catmain|1948}} {{ancat}} {{Decadă categorie antet|decadă=1940}}

Categorie:Anii 1940 Categorie:Ani

De la Categorie:1950 până la Categorie:2020 sunt deja făcute.--Babu (discuție) 3 ianuarie 2020 18:38 (EET)[răspunde]

După înlocuirea lui decadă cu deceniu vor trebui refăcutți toți anii.--Strainu (دسستي‎)  23 ianuarie 2020 20:58 (EET)[răspunde]
Rezolvat Rezolvat--Strainu (دسستي‎)  24 ianuarie 2020 00:14 (EET)[răspunde]
Yes check.svg Realizat și pentru decenii--Strainu (دسستي‎)  24 ianuarie 2020 18:06 (EET)[răspunde]

(printre|dintre) (cei|cele) mai...[modificare sursă]

[după o idee de Dan Mihai Pitea] Propun să adăugăm {{fe}} la sfârșitul frazelor care conțin afirmații de genul "printre cele mai..." fără a avea vreo sursă (<ref> sau {{Sfn}}) între "mai" și primul punct.

Aș fi vrut să lucrez și pe expresiile fără "printre" dar nu știu cum să identific corect și complet premiile ("cel mai bun..."). Mă poate ajuta cineva cu ceva idei aici?--Strainu (دسستي‎)  9 aprilie 2020 13:25 (EEST)[răspunde]

Mai bine nu, e nevoie de verificare, nu e adăugare automatică de etichete care vor rămâne cu anii acolo. --Mihai (discuție) 16 aprilie 2020 23:46 (EEST)[răspunde]
La Cafenea propusesem o soluție pentru expirarea {{nc}}, s-ar putea de extins ideea și pentru {{fe}}, {{co}} etc. //  Gikü  vorbe  fapte  16 aprilie 2020 23:58 (EEST)[răspunde]
Din punctul meu de vedere e mai constructiv dacă sunt verificate și corectate de către un homo sapiens 3 articole decât dacă sunt adăugate automat etichete în 10.000. --Mihai (discuție) 17 aprilie 2020 00:04 (EEST)[răspunde]

Evacuarea listelor de suverani și conducători din articolele despre ani[modificare sursă]

Datorită efortului gigantic al lui Serban Marin, aproape toate articolele despre ani au o secțiune numită „Suverani, conducători”: exemplu.

Solicit antrenarea unui robot în procesul de evacuare a acestor informații în articole separate, după modelul Listă de conducători de stat din 1913.

Am transferat manual câteva astfel de liste și lista de pași este următoarea:

  1. editează pagina YYY:
    1. copiază în clipboard tot conținutul secțiunii „Suverani, conducători” și șterge-l
    2. transformă titlul secțiunii din „Suverani, conducători” în „Vezi și”
    3. introdu în loc textul * [[Listă de conducători de stat din YYY]]
    • salvează pagina YYY
  2. creează pagina Listă de conducători de stat din YYY
    1. cutia de navigare la anii apropiați și introducerea pot fi generate cu {{subst:Utilizator:Gikü/san|YYY|subst=subst:}}
    2. inserează lista copiată mai sus
    3. scade cu 1 nivelul secțiunilor (== în loc de === și === în loc de ====)
    4. introdu categoriile [[Categorie:Liste de conducători de stat după ani|YYY]] și [[Categorie:YYY]]
    • salvează
  3. leagă cu elementul Wikidata potrivit, cel mai ușor prin intermediul limbii germane: Liste der Staatsoberhäupter YYY

//  Gikü  vorbe  fapte  16 aprilie 2020 00:36 (EEST)[răspunde]

Așteaptă. Cred că am găsit o soluție. Voi încerca cu GÜT. //  Gikü  vorbe  fapte  21 aprilie 2020 19:26 (EEST)[răspunde]
În desfășurare. Special:Contribuții/GÜT. //  Gikü  vorbe  fapte  30 aprilie 2020 00:30 (EEST)[răspunde]
Rezolvat Rezolvat. 1.440 de articole au fost create. //  Gikü  vorbe  fapte  2 mai 2020 01:24 (EEST)[răspunde]
Care sunt aceste articole?--109.166.138.105 (discuție) 2 mai 2020 02:56 (EEST)[răspunde]

Pentru referință: toate articolele create sunt legate de la Liste de conducători de stat după ani și se găsesc în Categorie:Liste de conducători de stat după ani. //  Gikü  vorbe  fapte  16 mai 2020 15:03 (EEST)[răspunde]

prolific --> productiv[modificare sursă]

Avem de-a face cu folosirea greșită a cuvântului „prolific”. Prolific (de la „proles”) înseamnă „cu mulți copii”, respectiv „care se înmulțește repede”. Ar fi bine dacă un robot ar fi programat să înlocuiască prolific cu productiv în cazul tuturor biografiilor (scriitori, astronomi, fotbaliști etc.). Informația că aceștia ar fi fost prolifici nu este enciclopedică. Termenul trebuie păstrat la articolele despre plante, animale etc. (Lycosa prolifica, Limba mielului ș.a.m.d.). --Mihai Andrei (discuție) 23 aprilie 2020 12:34 (EEST)[răspunde]

Nu e cazul, a se vedea [3]--Strainu (دسستي‎)  23 aprilie 2020 14:53 (EEST)[răspunde]
Păcat că vă pripiți și că nu vreți o exprimare precisă. Înțelesul termenului este clar: [4]. Dacă doriți o enciclopedie, atunci stăviliți folosirea improprie a cuvintelor. Că doar nu-i putem lăsa pe copii să descopere [5] că Josef Bican ar fi fost „cel mai prolific fotbalist din toate timpurile.” --Mihai Andrei (discuție) 23 aprilie 2020 15:42 (EEST)[răspunde]

Comitate din Michigan[modificare sursă]

Am observat că multe articole din categoria Comitate din statul Michigan, SUA conțin o eroare legată de heading-ul Note și singura referință dată nu furnizează niciun text (a se vedea exemplu aici). Poate s-ar putea corecta rapid cu un bot.-- Alex N  (mesaj) 5 mai 2020 22:32 (EEST)[răspunde]

Mă ocup. //  Gikü  vorbe  fapte  5 mai 2020 23:25 (EEST)[răspunde]
Rezolvat Rezolvat. Mulțumesc pentru semnalare. //  Gikü  vorbe  fapte  6 mai 2020 00:03 (EEST)[răspunde]

Imagini din DER transferate la Commons[modificare sursă]

@Andrei Stroe: Șterge, te rog, dacă ai timp și chef, cu Andrebot imaginile din DER și cele de pe lacul Oasa transferate la Commons. Le-am verificat pe toate, licențele, atribuirea și categorizarea sunt bune. Am pregătit lista aici – Utilizator:Gikü/DER. Mulțumesc. //  Gikü  vorbe  fapte  14 mai 2020 23:51 (EEST)[răspunde]

Marchez ca Rezolvat Rezolvat. Mulțumesc! //  Gikü  vorbe  fapte  15 mai 2020 20:31 (EEST)[răspunde]

Districte din Thailanda[modificare sursă]

Câteva articole din {{Amphoe în Nakhon Ratchasima}} (posibil și altele de la Categorie:Formate districte Thailanda) prezintă text netradus, care a fost introdus automat (exemplu: Districtul Chum Phuang). S-ar putea rezolva cu un bot? -- Alex N  (mesaj) 16 mai 2020 02:02 (EEST)[răspunde]

Rezolvat Rezolvat Am trecut prin ele manual, dacă mai găsesc ceva netradus voi înlătura.— Ionutzmovie discută 21 iunie 2020 23:44 (EEST)[răspunde]

Introducere așezare[modificare sursă]

Sunt o mulțime de articole unde doar un robot poate adăuga {{subst:Introducere așezare}} după prima și totodată singura frază/propoziție.

Multe articole, ca de ex. acesta, ar trebui rescrise de la zero cu un robot.

După {{subst:Introducere așezare}} trebuie adăugată secțiunea Note; apoi secțiunea Legături externe cu site-ul oficial luat de pe wikidata; după secțiunea Vezi și la sfârșit prima dată trebuie pus formatul de navigare localități (aici {{Aachen}}), apoi ciot, apoi {{Informații bibliotecare}} (sau așa știam eu că este ordinea, se poate discuta).

Se poate începe cu articolele din aceste formate de navigare pe districte în Germania.--TerraFlorin [discuție] 11 iulie 2020 08:21 (EEST)[răspunde]

{{Introducere așezare}} nu ar trebui introdus prin substituție. Rolul lui este să preia direct informațiile de la Wikidata și să le actualizeze pe măsură ce apar date noi sau suplimentare. Dar da, sunt multe articole despre localități care ar trebui regenerate. —Andreidiscuție 14 iulie 2020 11:45 (EEST)[răspunde]

Orașe în/din Germania[modificare sursă]

E nevoie de înlocuirea formatului învechit {{Cutie Localități DE}} (și redirectului său {{Infobox German location}}) cu formatul standard {{Infocaseta Așezare}}. Formatele vechi au dezavantajul că întroduc în pagini și categoriile cu denumirea după tipicul Orașe în.

Este vorba de următoarele categorii:

--Mihai (discuție) 3 septembrie 2020 09:30 (EEST)[răspunde]

Soluția imediată a problemei în/din e Special:Diff/13593906. //  Gikü  vorbe  fapte  3 septembrie 2020 09:35 (EEST)[răspunde]

Acestă/Această[modificare sursă]

Exista o greșeală care se repetă în peste 1300 de pagini, anume „acestă” în loc de „această”. Nu se poate corecta automat?--8989989a 7 noiembrie 2020 21:28 (EET)[răspunde]

Pictogram voting wait.svg În procesare... //  Gikü  vorbe  fapte  8 noiembrie 2020 15:33 (EET)[răspunde]
Îmi cer scuze, am vrut să încep dar nu mi-a mai ajuns timp. //  Gikü  vorbe  fapte  19 noiembrie 2020 17:43 (EET)[răspunde]

Aceeași tip de greșeală se repetă pentru „aceast” în loc de „acest” (de peste 700 de ori).--8989989a 18 noiembrie 2020 09:13 (EET)[răspunde]

Pictogram voting wait.svg În procesare... Strainu (دسستي‎)  18 noiembrie 2020 13:56 (EET)[răspunde]
Rezolvat Rezolvat--Strainu (دسستي‎)  18 noiembrie 2020 17:41 (EET)[răspunde]

Mesaje nesemnate[modificare sursă]

Sunt total pe lângă ce înseamnă automatizările acestea, așa că vă rog să mă scuzați dacă ceea ce spun e prostesc. Ar fi posibilă crearea/acționarea un robot existent pentru a pune formatul {{subst:nesemnat|}} automat, la scurt timp, la sfârșitul mesajelor nesemnate de anonimi și utilizatori înregistrați? Ar elimina această muncă în folosul orientării timpului spre antivandalism.--Kun Kipcsak (discuție) 22 noiembrie 2020 12:53 (EET)[răspunde]

Am încercat mai demult să creez unul, dar nu am obținut rezultatele dorite. Pe vremea aceea, robotul de la en.wp care făcea asta era closed source. Acum nu mai știu exact cum stă treaba.
O soluție mai bună ar fi să începem să folosim (măcar pentru început opțional, în paginile de discuții ale cui vrea) Structured Discussions. Elimină de una singură grija semnăturii, indentării mesajelor și arhivării paginilor de discuție. —Andreidiscuție 22 decembrie 2020 17:40 (EET)[răspunde]

Format:Proiect Aniversări[modificare sursă]

Un robot ar trebui să adauge formatul {{Proiect Aniversări}} sau o variantă a acestui format, sus, pe paginile de discuție ale zilelor anului. Ca de ex. aici. E prea mult de lucru pe mod manual. --Terraflorin (discuție) 22 decembrie 2020 15:36 (EET)[răspunde]

Yes check.svg Realizat. —Andreidiscuție 22 decembrie 2020 17:36 (EET)[răspunde]

Senatori și deputați 2020[modificare sursă]

Vreau să rulez același cod din 2016. Dacă aveți sugestii de îmbunătățire a articolelor standard vă rog să le puneți aici.--Strainu (دسستي‎)  28 decembrie 2020 15:41 (EET)[răspunde]

Hai să încercăm să ne sprijinim mai mult pe Wikidata. Să folosim {{Date biografice}} și să conectăm articolele la itemurile de Wikidata. Eu deja am început să le creez pe cele noi/actualizez pe cele vechi, am început cu Camera Deputaților, luând pe județe, și am ajuns la județul Cluj. Nu e chiar laborios, sunt doar câteva sute de itemuri. —Andreidiscuție 28 decembrie 2020 17:34 (EET)[răspunde]
Andrei Stroe ai vreun query pe care îl pot folosi? Strainu (دسستي‎)  29 decembrie 2020 03:44 (EET)[răspunde]
O să-l pregătesc. În principiu, va fi ceva de genul ia toți oamenii cu proprietatea funcție deținută (P39) = deputat al României (Q17556530) având calificator cu legislatură (P2937) = legislatura 2020–2024 (Q104535655). Și ceva echivalent pentru senatori. —Andreidiscuție 29 decembrie 2020 12:54 (EET)[răspunde]
@Strainu: Uite aici query. Am ajuns cu deputații la Mureș, nu mai am mult. —Andreidiscuție 30 decembrie 2020 10:48 (EET)[răspunde]
Am terminat cu deputații noi. Query-ul de mai sus ar trebui să-i returneze pe toți. Am făcut bine că am mers așa: unii sunt foști primari care deja aveau item, am găsit și un articol duplicat la ro.wp; și alte câteva duplicate la Wikidata. Alexandru Rafila avea chiar 3 itemuri separate la Wikidata. —Andreidiscuție 3 ianuarie 2021 00:43 (EET)[răspunde]
Lipsesc 10. Query-ul întoarce 319, dar sunt 329.--Strainu (دسستي‎)  3 ianuarie 2021 01:55 (EET)[răspunde]
Am mai corectat erori, și am 328. Nu știu care lipsește. Sumele pe județe par să fie ok, grupul minorităților are și el toți cei 18 membri. —Andreidiscuție 7 ianuarie 2021 15:52 (EET)[răspunde]
I-am luat la mână și sunt probleme de caching. Eu am 324 de rezultate, lipsesc Nicolae-Miroslav Petrețchi (Q28113950), Marilen-Gabriel Pirtea (Q28113956), Angelica Fădor (Q24027545), Cristina-Elena Dinu (Q28050355), Csaba Könczei (Q104536243) care par să aibă tagurile bune, deci e OK. Îi mai las o săptămână să se sincronizeze.
În altă ordine de idei, Mircea Chelaru (Q12735679) sigur e același cu Mircia Chelaru?--Strainu (دسستي‎)  7 ianuarie 2021 23:57 (EET)[răspunde]
Din ce am citit despre el, da. Corespunde și data nașterii. Eu creasem itemul Mircia Chelaru, dar Mircea Chelaru exista deja, și Romanichthys Valsanicola i-a adăugat și funcția nouă, de l-am găsit duplicat în query-ul de deputați.
KlaudiuMihaila a derulat recent niște operațiuni masive, care au modificat calificativul circumscripție electorală (P768) la toți deputații, noi și vechi. Cred că e nevoie de ceva timp să se sincronizeze cache-urile.  —Andreidiscuție 8 ianuarie 2021 19:06 (EET)[răspunde]
Mare ți-e grădina... Credeam că băiatul ăla trecut pe la 8 partide (cu tot cu reveniri) e special, dar Chelaru e și mai și.--Strainu (دسستي‎)  8 ianuarie 2021 21:53 (EET)[răspunde]
Uite query și pentru senatori. —Andreidiscuție 12 ianuarie 2021 20:43 (EET)[răspunde]
Yes check.svg Realizat Au mai rămas 2 deputați, mă ocup în zilele următoare--Strainu (دسستي‎)  14 ianuarie 2021 01:53 (EET)[răspunde]

Cred că ar avea sens de adăugat în masă și {{bpv}} în paginile de discuții. Poate chiar o listă de proiecte, și cu parametrul living=yes. //  Gikü  vorbe  fapte  13 ianuarie 2021 23:47 (EET)[răspunde]

Mă ocup zilele următoare.--Strainu (دسستي‎)  14 ianuarie 2021 01:53 (EET)[răspunde]
@Strainu: FYI se pare că o face Mishu57 manual. //  Gikü  vorbe  fapte  14 ianuarie 2021 13:15 (EET)[răspunde]

Un caz special e la Attila Kelemen. A fost unul născut în 1948, acum e unul născut în 1986. La fel la Gábor Hajdú. Ceva sugestii de dezambiguizare a titlului?--Strainu (دسستي‎)  14 ianuarie 2021 01:58 (EET)[răspunde]

Dacă vorbim de persoane cu același nume, prenume și profesie, vezi Alexandru Moraru (dezambiguizare). //  Gikü  vorbe  fapte  14 ianuarie 2021 02:29 (EET)[răspunde]
„Profesia” lor fiind aceea de deputați? --Pafsanias (discuție) 14 ianuarie 2021 02:33 (EET)[răspunde]
Ocupație. //  Gikü  vorbe  fapte  14 ianuarie 2021 02:46 (EET)[răspunde]
Vocație. --Pafsanias (discuție) 14 ianuarie 2021 03:14 (EET)[răspunde]
Îndeletnicire.--Kun Kipcsak (discuție) 14 ianuarie 2021 14:43 (EET)[răspunde]

Secțiune goală[modificare sursă]

Ar fi util un robot care să (mai) adauge {{Secțiune goală}} acolo unde este cazul. --Terraflorin (discuție) 3 februarie 2021 10:49 (EET)[răspunde]

Eroarea respectivă de la CheckWiki este dezactivată. Există o altă metodă de a genera lista de pagini cu secțiuni goale? //  Gikü  vorbe  fapte  3 februarie 2021 12:41 (EET)[răspunde]
Poate o mică programare care să verifice dacă după == urmează din nou (peste un rând două mai jos) tot == --Terraflorin (discuție) 19 februarie 2021 15:52 (EET)[răspunde]

@Gikü:Apropo, aici zice că:

Following tools can correct the problem:

AutoWikiBrowser (AWB) (most, but not all cases)

WPCleaner

--Terraflorin (discuție) 19 februarie 2021 15:56 (EET)[răspunde]

Număr de articole create[modificare sursă]

Dacă tot s-a rezolvat cu secțiune goală, ar fi util un bot care să completeze și să actualizeze tabelele din Wikipedia:Lista wikipediștilor după numărul de articole. --Terraflorin (discuție) 12 februarie 2021 12:41 (EET)[răspunde]

@Andreyyshore: e ceva ce vă interesează?--Strainu (دسستي‎)  12 februarie 2021 15:04 (EET)[răspunde]
Am testat o interogare SQL pe Quarry. Se execută în aproximativ 2 minute și dă o eroare de 5–10 articole/utilizator față de XTools pentru mulți utilizatori cu cel puțin câteva sute de articole create. Potrivit rezultatelor mele, până acum:
  • peste 9.999 de utilizatori autentificați (incl. roboți) au creat cel puțin un articol (posibil să fie în jur de 11.214, dar am trunchiat rezultatul);
  • 3.666 de utilizatori autentificați (incl. roboți) au creat cel puțin două articole;
  • 2.363 de utilizatori autentificați (incl. roboți) au creat cel puțin trei articole;
  • 18.895 de articole au fost create de IP-uri – mai mult decât cel mai productiv utilizator uman autentificat (care a și inițiat cererea, de altfel) și mai puțin decât patru roboți.
O listă de 5.000 de utilizatori, cum se dorește acum, mi se pare prea lungă și nici nu pot face departajări. Propun să mențin, în viitorul apropiat, o listă de doar 500 sau 1.000 de utilizatori (cu posibilitate de depășire în caz de egalitate pe ultimul loc – în prezent, pozițiile 491–500 ar fi ocupate de utilizatori cu câte 28 de articole create, iar pozițiile 975–1.037 ar fi pentru cei cu câte 9 articole create).
Care credeți că ar trebui să fie pragul? —  Andreyyshore  D  C  18 feb. 2021, 05:47 (EET) 
Cred că un prag de 10 articole e mai potrivit decât un număr de conturi. Dacă în viitor query-ul devine prea lung, putem mări pragul.--Strainu (دسستي‎)  18 februarie 2021 11:15 (EET)[răspunde]
Am pornit de la lista cu 5.000 de utilizatori împărțită în 5 de pe en.wiki, dar evident trebuie să păstrăm proporțiile. 500 ar fi ideal sau e f bună și ideea lui Strainu. --Terraflorin (discuție) 18 februarie 2021 12:22 (EET)[răspunde]
OK. O să merg deocamdată pe ideea lui Strainu.
Am mai adăugat o condiție: ca articolele să nu fie pagini de dezambiguizare.
De asemenea, cred că am găsit motivul discrepanței dintre numărătoarea mea și cea de la XTools și cred că a mea este mai corectă. Am luat, la întâmplare, cazul utilizatorului Solt, care la mine apăreaapare cu 349 de articole, înainte de a elimina cele 9 dezambiguizări pe care le-a creat: pe XTools apare o listă de 350 de articole create, inclusiv „Hvar”, care mai apare și la utilizatorul Danutz. De fapt, articolul a fost creat de Danutz, dar a fost mutat o perioadă la „Hvar (oraș)” de Solt, împărțit în două articole de Andrebot și apoi reunificat de Ionutzmovie (cu mutarea istoricului de la o pagină la alta). Probabil există mai multe pagini cu situații similare.
Dacă nu sunt obiecții, o să încerc și niște teste automate peste câteva zile; vreau întâi să restructurez puțin codul pentru listele după numărul de editări. —  Andreyyshore  D  C  18 feb. 2021, 16:51 (EET) 
Uneori crearea paginilor de dezambiguizare poate consuma mai mult decât cea a unui articol obișnuit... :) //  Gikü  vorbe  fapte  18 februarie 2021 16:52 (EET)[răspunde]
Am mai rulat o interogare pentru a determina câte articole există cu sau fără dezambiguizări, iar varianta care include paginile de dezambiguizare este mult mai apropiată de contorul de pe pagina principală. Retrag condiția. —  Andreyyshore  D  C  18 feb. 2021, 17:12 (EET) 
În câteva minute ar trebui să se vadă prima modificare in-place. Am rescris mare parte din robot (am scăpat de callback hell și de jQuery) și de acum va fi mult mai simplu și mai rapid să adaug funcționalități noi și să controlez felul în care se înlănțuie toate operațiile. —  Andreyyshore  D  C  2 mar. 2021, 23:58 (EET) 

Filmografii[modificare sursă]

Mă întreb cum ar funcționa un bot care să introducă automat filmografii în paginile unor actori (care au filmografia incompletă sau parțială; sau actori care nu au deloc pagină pe ro.wiki, aici deja e mai complicat dar se poate folosi ceva de genul).

Dacă bot-ul ar copia secțiunea Filmography de la en.wiki, sunt câteva cuvinte cheie care apar în toate filmografiile și care se pot traduce automat. Ex: „! Year” cu „! An” (am pus semnul exclamării ca să nu traducă și prin titlul filmului, or fi câteva cu Year în titlu); „Episode:” cu „Episodul:”; „ episodes” cu „ episoade” (aici sunt mai multe exemple, le-aș putea enumera dacă se ajunge la o concluzie de lucru - le-am tot folosit prin Notepad cu fereastra Find/Replace). Apoi ar fi bine ca bot-ul să verifice dacă anumite filme/seriale din filmografie există pe ro.wiki și să le schimbe denumirea în varianta de la noi. --Terraflorin (discuție) 19 februarie 2021 15:47 (EET)[răspunde]

Ca să puteți fi ajutat, trebuie să oferiți informații ceva mai structurate:
  • Lista de articole vizate
  • Structura după care trebuie căutat
  • Exemplu de cum trebuie să arate rezultatul --Strainu (دسستي‎)  19 februarie 2021 19:37 (EET)[răspunde]

@Strainu:În plus, ar fi bun un bot să schimbe {{uncredited}} cu nemenționat. Lista de articole vizate: Să vin cu o lista de actori care nu au pagină pe ro.wiki sau cu una la care să fie modificată filmografia? Structura - ca mod de lucru mă gândesc să copiez filmografiile unor actori de la en.wiki la ro.wiki și apoi să creez o listă cu acești actori pentru ca bot-ul să intervină ulterior în fcț. de această listă. Să creez și o listă de expresii și cuvinte care apar des în orice filmografie de la en.wiki și cu ce ar trebui tradus? Un exemplu simplu ar fi aici Andrew_Prine#Filmografie, dar mai sunt și cele structurate în tabele, nici en.wiki nu are un standard despre cum trebuie scrisă o filmografie. --Terraflorin (discuție) 20 februarie 2021 11:11 (EET)[răspunde]

Roboții nu pot lucra - ușor - pe date nestructurate. Fiecare tip de filmografie e practic un cod diferit de parsare. Cu cât cerința e mai abstractă, cu atât e mai mult de muncă și șanse mai mici să o facă cineva.
Dacă ar exista un singur tip de filmografie, ați putea forma lista astfel: alegeți un actor, mergeți la Wikidata, alegeti o afirmație (de ex. ocupație (P106)->actor de film (Q10800557)). Lângă element găsiți 3 puncte orizontale. Când apăsați pe ele, se deschide o fereastră cu un query ce conține un număr de alți actori. În partea dreaptă a ferestrei sunt mai multe iconițe - o selectați pe cea ca un lanț și va apărea un url de tipul https://w.wiki/$a2. Puteti să ne dati acel URL și mai filtrează eventual autorul robotului query-ul să aibă articole atât la en.wp cât și la ro.wp.--Strainu (دسستي‎)  20 februarie 2021 11:42 (EET)[răspunde]

Teoria coardelor[modificare sursă]

[6] [7] Solicit un bot care să schimbe [[Teoria corzilor]] în Teoria coardelor (și să mai și patruleze pe viitor dacă mai apar astfel de editări). Sunt 30 de elemente care necesită această modificare. --Terraflorin (discuție) 12 martie 2021 13:39 (EET)[răspunde]

Realizat. --Mihai (discuție) 13 martie 2021 08:06 (EET)[răspunde]
Făcusem inițial numai linkurile, dar între timp am înlocuit sintagma și în articole și la Wikidata; mai erau în 23 de articole și linkuri către teoria supercorzilor -> teoria supercoardelor (transcluse, ar trebui să se rezolve după actualizarea cache-ului). Dar ca să fie clar, am făcut asta cu find and replace, nimic fancy, deci nu e un task recurent. --Mihai (discuție) 13 martie 2021 09:42 (EET)[răspunde]

Romane după an[modificare sursă]

În cele 223 de pagini ale Categoriei:Romane după an doar în câteva am introdus manual formatul {{Romanean}}, modificarea e mai complexă de genul [8], [9] - adăugare format cu parametrii după an, ștegere <br> și cele 14 categorii care urmează și pe care le generează (în parte) formatul, curățenie rânduri goale. Poate un robot face acest lucru ? --Terraflorin (discuție) 10 aprilie 2021 11:19 (EEST)[răspunde]

Cel mai simplu ar fi rescrierea completă a acestor categorii.--Terraflorin (discuție) 17 aprilie 2021 15:07 (EEST)[răspunde]

Protejări expirate[modificare sursă]

Ar trebui să existe un robot care să elimine periodic lacătul din paginile listate la Categorie:Pagini a căror protecție a expirat. --NGC 54 (discuție / contribuții) 17 aprilie 2021 17:49 (EEST)[răspunde]

GFDL license update[modificare sursă]

Hi! There are 425 files left in Categorie:Wikipedia license migration candidates. My guess is that about 300 of them are eligible for a relicense because of the upload date. I made a few edits like Special:Diff/14243238 with my bot. Those edits were made on old uploads with an -excepttext:”(opt|out|VRT|OTRS)”. I wonder if any local bot users have time to fix or if I should do it with my bot. Next question is if 425 edits are too many to do without a bot flag? If I do it like Special:Diff/14243149 it will not be with a bot flag so the result is the same. I think all 224 files on Utilizator:MGA73/teste are eligible except if they have an "opt-out" or an OTRS. So they should be easy to fix with a bot. --MGA73 (discuție) 26 iunie 2021 13:59 (EEST)[răspunde]

I moved this section here so it can be discussed more broadly.--Strainu (دسستي‎)  26 iunie 2021 21:08 (EEST)[răspunde]

The question is if anyone would like to fix it? If yes: Great, thank you. If no: Do I need a bot flag or can I do those few edits without a flag? --MGA73 (discuție) 2 iulie 2021 17:01 (EEST)[răspunde]

This code should do the trick if anyone with a bot would like to run it:

pwb.py replace.py -lang:ro -family:wikipedia -links:"User:MGA73/teste" -putthrottle:5 -dotall -regex -nocase -summary:"Eligible for [[Wikipedia:Image license migration|GFDL relicense]]. Uploaded before November 2008."  ”\{\{\s*(GFDL)\s*\}\}” ”{{\1|migration=relicense}}” -excepttext:”(opt|out|VRT|OTRS)”

--MGA73 (discuție) 10 iulie 2021 20:47 (EEST)[răspunde]

Yes check.svg Realizat--Strainu (دسستي‎)  10 iulie 2021 21:43 (EEST)[răspunde]

Thank you Strainu! Files from before August 2009 should be okay too unless they are from the Internet. So this time we should also exclude www and http. This code should do the trick:

pwb.py replace.py -lang:ro -family:wikipedia -links:"User:MGA73/teste" -putthrottle:5 -dotall -regex -nocase -summary:"Eligible for [[Wikipedia:Image license migration|GFDL relicense]]. Uploaded before August 2009."  "\{\{\s*(GFDL)\s*\}\}” ”{{\1|migration=relicense}}" -excepttext:"(opt|out|VRT|OTRS|www|http)"

--MGA73 (discuție) 11 iulie 2021 01:07 (EEST)[răspunde]

Strainu I think if you could do the run above then the number of files in Categorie:Wikipedia license migration candidates would be less than 100. That could be fixed manually. --MGA73 (discuție) 15 iulie 2021 13:46 (EEST)[răspunde]

Yes check.svg Realizat No more need for a bot. The rest needs to be checked manually or are allready on Commons and can be deleted. --MGA73 (discuție) 20 iulie 2021 20:58 (EEST)[răspunde]

Bunuri culturale mobile clasate în Patrimoniul Cultural Național[modificare sursă]

La 10 ani după LMI a venit timpul pentru un nou import de mari dimensiuni de la Institutul Național al Patrimoniului (INP). INP a relansat recent portalul dedicat și a eliberat conținutul, text și imagini, sub licența CC-BY-SA. Propun deci două importuri, de text și imagine, precum și construirea unor secțiuni automate; toate operațiile sunt descrise mai jos în subsecțiuni dedicate pentru a putea fi discutate separat. Strainu (دسستي‎)  4 septembrie 2021 01:10 (EEST)[răspunde]

Importul listei[modificare sursă]

Importul listei va merge după modelul de la LMI:

  1. Vom avea o pagină principală care va descrie în mare ce sunt bunurile culturale mobile clasate și va conține legături spre celelalte pagini.
  2. Din motive de limitări tehnice, lista va fi împărțită după domeniu și categoriejudeț (Lista bunurilor culturale mobile din domeniul carte veche și manuscris clasate în categoria tezaurLista bunurilor mobile din Patrimoniul Cultural Național aflate în județul Bistrița-Năsăud (carte veche și manuscris) ar fi cel mai lung titlu). Ordonarea în cadrul listei se va face după județul unde se află obiectul (alternativ: după data clasării) categorie și data clasării. În cazul în care pentru unele județe depășim limitele, vom diviza și după categorie.
  3. Lista va fi construită cu formate care vor reflecta structura tabelului de la sursă, nu neapărat în aceeași ordine. Pe lângă câmpurile de acolo, vom mai avea:
    1. Categoria (tezaur/fond)
    2. [opțional] Poziția (din ordinul de clasare)
    3. url_inp (id-ul paginii de detaliu; de exemplu în pagina [10], idul e 7BE87BAC335647B3B4495C32035F8F1C. E suficient pentru a reconstrui legătura către Cimec.)
    4. url_sursă (un URL către pagina obiectului pe site-ul deținătorului; NU va fi adăugat automat)
    5. Q (entitatea Wikidata; va fi populat în cazul în care va exista un import la Wikidata și va permite extragerea unor informații suplimentare)
  4. În pagina de discuții va fi inclus formatul {{DateCimec}} cu legături către lista filtrată (exemplu: carte veche + tezaur). Formatul va fi actualizat pentru a deveni mai flexibil.
  5. În primă fază nu voi include în listă detalii care nu sunt disponibile în listele Cimec, ci doar în paginile de detalii (e.g. descrierea, materiale etc.). Pe măsură ce codul va evolua și voi deveni mai familiar cu structura, putem discuta despre mai multe informații.
  6. Fiecare element va fi importat individual, cu autorul fișei și legătura către pagina de detaliu menționate în descrierea modificării pentru a respecta cerințele licenței.
  7. Listele vor fi categorisite după domeniu și categorie.

Completarea ulterioară a listei nu se va baza foarte mult pe contribuții automate, atât pentru că lista e deja aproape completă la sursă, cât și pentru că nu există un id ușor identificabil sau o listă unitară. Voi încerca să identific muzeele deținătoare, acolo unde ele există, folosind id-ul din ghidulmuzeelor, care este disponibil în pagina de detalii, și să introduc legături interne atunci când există articolul pe ro.wp. Identificarea autorilor se va face cu niște reguli simple și voi folosi Wikidata pentru a extrage data morții. Voi avea însă cu siguranță nevoie de ajutor pentru a realiza aceste asocieri. De asemenea, articolele Wikipediei, dacă există, vor trebui adăugate manual.

Întrebări deschise:

  • E mai bine ca în interiorul listei să grupăm după județ sau după dată? Dacă folosim județul, putem împărți listele în secțiuni și apoi se pot realiza pagini per județ prin transcludere cu {{lsth:}}
  • Putem găsi un titlu mai scurt pentru articole?Strainu (دسستي‎)  4 septembrie 2021 01:10 (EEST)[răspunde]
Cam așa ar arăta tabelul. Va mai exista și o introducere și categorii.--Strainu (دسستي‎)  17 noiembrie 2021 02:13 (EET)[răspunde]
@Accipiter Gentilis Q., @Gikü: dacă tot mi-ați băgat în seamă efortul, mai am o rugăminte. Aruncați-vă o privire pe listele deja create și spuneți-mi ce probleme vedeți. Cel mai probabil nu se vor afișa corect imaginile: e normal, e prima dată când sunt generate imaginile la dimensiunea aceea și există o limită de generare/ip; puteți ajuta dând refresh de mai multe ori. Mulțumesc! Strainu (دسستي‎)  4 decembrie 2021 19:00 (EET)[răspunde]
  • În prima coloană din stânga cuvintele încep când cu literă mare, când cu literă mică. Ar fi necesară uniformizarea, preferabil fiind să înceapă cu literă mare
  • La Bunuri mobile din domeniul arheologie trebuie musai una sau 2 coloane care să conțină date cel puțin despre localizarea temporală Epoca/Perioada, Etnie/Cultura. Asta le definește de fapt. Pot înlocui coloanele Clasare și/sau Categorie, pentru a nu aglomera lista cu date. Să presupunem că mâine pică siteul CIMEC, de unde se iau datele astea, când folosești o imagine într-un articol sau vrei să vei ce e cu ea ? La urma urmei când o pui într-un articol, scrii la explicații ceva de genul: "Amforă de ofrandă din Epoca bronzului Cultura Monteoru (+/- găsită la Bogdănești, județul Bacău)". De aceea, cel mai bine ar fi și o a treia coloană care să rezume locul descoperirii. Rezumând: pentru simplificare, coloanele Clasare și Categorie pot să dispară, info respective fiind fie scoase (rămânând accesibile doar prin linkul spre CIMEC) sau mutate în coloana Legături, sub forma unui link [http://clasate.cimec.ro/Detaliu.asp?k=F3DA9C3864E9496AAFAA7DB5F089F26F 2290/01.06.2010 - Tezaur; Poziția 2] O coloană disponibilă se poate obține mutând info din coloana Localizare: de exemplu în loc de Colecție particulară + Iordania --> Colecție particulară, Iordania, sau Muzeul de Mineralogie Baia Mare + Baia Mare, Muzeul de Mineralogie Baia Mare, Baia Mare
  • Idem la Bunuri mobile din domeniul artă decorativă, trebuie să existe coloanele Datare, Școală, Material/Tehnică (text), cu sau fără scoaterea coloanelor Clasare & Categorie cu/fără mutarea info din coloanele respective la Legături.
  • Idem la Bunuri mobile din domeniul artă plastică coloanele Datare, Școală, Material/Tehnică (text) Dimensiuni
  • Idem la Bunuri mobile din domeniul documente Datare, Material, Tehnică, Dimensiuni
  • Idem la Bunuri mobile din domeniul carte veche Datare, Material, Dimensiuni
  • Idem la Bunuri mobile din domeniul etnografie Etnie/Cultură Loc de descoperire, Material Tehnică (Text) Datare Dimensiuni
  • Idem la Bunuri mobile din domeniul istorie Datare, Școală, Loc de descoperire, Material/Tehnică (text) Dimensiuni
  • Idem la Bunuri mobile din domeniul științele naturii Loc de descoperire, Dimensiuni
  • Idem la Bunuri mobile din domeniul știință și tehnică Datare, Loc de descoperire, Material/Tehnică (text) Dimensiuni
  • Dacă nu dispar coloanele respective (eu sunt pentru ca ele să dispară, ar fi necesare modificări de titluri pentru o claritatate suplimentară:
  • Clasare (Nota Bene: formulare ambiguă) --> Ordin de clasare
  • Categorie (Nota Bene: foarte vag) --> Categorie juridică (Nota Bene: de exemplu coloana Categorie (juridică) poate fi înlocuită pur și simplu cu o categorizare propriu zisă de tipul Categorie:Tezaur CIMEC sau Categorie:Fond CIMEC)
  • Legături --> Fișă CIMEC
Rezumând: ar fi de de la 2 la 5 coloane, din care 3 coloane se pot obține în locul coloanelor Localizare & (Ordin de) clasare & Categorie (juridcă) Info actuale din coloana Localizare pot fi transferate liniștit în coloana Deținător, iar coloana Categorie (juridică) poate fi înlocuită cu o categorizare propriu zisă de tipul Categorie:Tezaur CIMEC sau Categorie:Fond CIMEC). Info din coloana (Ordin de) clasare poate fi introdusă în coloana legături sub formă de link spre fișa CIMEC. Pinguiesc și pe @Asybaris01:, @Țetcu Mircea Rareș:, poate au idei mai bune.
  • „E mai bine ca în interiorul listei să grupăm după județ sau după dată? ”
    Vă referiți la o listă realizată prin transcludere care să conțină toate bunurile județului ? Oricum lista județului e în categoria județului respectiv...
  • Titlu: Bunuri culturale mobile (+/- clasate) în Patrimoniul Cultural Național (Nume Județ, Nume Domeniu). Pun mai jos variantele (actuală și propusă, pentru comparație):
Bunuri mobile din domeniul arheologie clasate în patrimoniul cultural național al României aflate în județul Sibiu
Bunuri culturale mobile clasare în Patrimoniul Cultural Național (Județul Sibiu, arheologie)
Bunuri culturale mobile în Patrimoniul Cultural Național (Județul Sibiu, arheologie)
  • @Strainu: vedeți mai sus. --Accipiter Gentilis Q.(D) 6 decembrie 2021 13:27 (EET) P.S. Ar fi trebuit să-mi dau cu părerea înainte de generarea tabelelor actuale, dar neavând pagina în supraveghere, până nu am fost pinguit și nu am accesat mai multe tipuri de liste nu mi-am dat seama de ce e de fapt important și ce nu.[răspunde]
    Din păcate nu e tocmai fezabil să generez formate diferite în tabele diferite. Aș putea să încerc să fac dump la toate câmpurile peste tot și să le controlez afișarea din Lua, dar sunt șanse mari ca la București, unde sunt mii de intrări în listă, să lovesc vreo limită oarecare a site-ului. Experimentăm, dar nu promit.
    Dacă nu se poate, o să pun categoria ca un header intermediar și scot Clasare și pun Datare. Eu eram interesat și dacă ar fi util de pus descrierea. Strainu (دسستي‎)  6 decembrie 2021 15:03 (EET)[răspunde]
Bun, atunci ne referim la 3 coloane peste tot, toate 3 putând fi obținute din coloanele actuale. Una va fi o coloană care va include descrierea, descriere în care se importă inclusiv ceea ce ar fi pe celelalte +/- 3 coloane (intrările sun separate în fișele CIMEC și pot fi importate ca atare, presupun, diferențiat, pentru a popula descrierea). Când ziceți de descriere însă vă referiți la textul din partea de deasupra fișei CIMEC, nu ? Ar fi the best, să fie luate și info de acolo. BTW, aș renunța complet la chestii de genul 2241/08.06.2006 - Tezaur; Poziția 12, că în definitiv asta interesează în primul rând pe CIMEC și aproape de loc pe cineva care accesează Wiki și aș păstra doar linkul spre fișa CIMEC. --Accipiter Gentilis Q.(D) 6 decembrie 2021 15:09 (EET)[răspunde]
Când spun nume de coloane, vorbesc de coloane din listă SAU elemente cu bold de pe pagina de descriere. De ex. la [11] descrierea este Seceră din bronz, cu nervură mediană și cu buton la mâner, are orificiu pentru prindere, patină bună. și coloanele disponibile pentru wiki sunt tip, titlu, descriere, deținător, domeniu, datare, epoca, loc de descoperire, material/tehnică, Fișă întocmită de, Fișă verificată de, Nr. Inventar, ordin de clasare.
Atenție la numele paginilor, unele vor fi împărțite și după categorie (din motive de mărime). Nu prea sună bine Bunuri culturale mobile în Patrimoniul Cultural Național (Județul Sibiu, arheologie, tezaur), nu? Strainu (دسستي‎)  6 decembrie 2021 15:43 (EET)[răspunde]
Deocamdată sunt în pană de alte idei, cu referire la scurtarea numelui.--Accipiter Gentilis Q.(D) 6 decembrie 2021 17:15 (EET)[răspunde]

Am mai șurubărit la câmpuri și s-a dovedit că școala, locul de descoperire, materialul și dimensiunile apar în 10-11 domenii (din 11). Le-am introdus alături de datare într-o coloană numită "detalii tehnice". Am mai umblat și la descriere pentru a include mai multe câmpuri, ca la imagini (se va vedea mai ales la numismatică). Exemple în județul Vâlcea.--Strainu (دسستي‎)  10 decembrie 2021 02:30 (EET)[răspunde]

Principial vorbind se pare ok șurubăreala, așa cum e acum. Totuși nu apar toate detaliile relevante: de exemplu perioada (e.g. La Tène) sau cultura (e.g. import roman), ori materialul (e.g.bronz) - e.g. v. poziția 1 Amforetă de aici.--Accipiter Gentilis Q.(D) 10 decembrie 2021 09:09 (EET)[răspunde]

Da, vom mai găsi sigur erori în date și vor trebui regenerate listele de mai multe ori. Am mai lucrat la cod pentru a putea genera listele și elementele din listă într-o ordine predictibila, pentru a nu încarca istoricul paginilor. Strainu (دسستي‎)  10 decembrie 2021 09:17 (EET)[răspunde]
Noile câmpuri de descriere sunt vizibile la Bunuri mobile din domeniul județul Vaslui clasate în patrimoniul cultural național al României aflate în numismatică (tezaur). Strainu (دسستي‎)  10 decembrie 2021 11:34 (EET)[răspunde]

Ups ! Bunuri mobile din domeniul județul Vaslui clasate în patrimoniul cultural național al României aflate în numismatică (tezaur) --> ? Better = Bunuri mobile din domeniul numismaticii din județul Vaslui clasate în patrimoniul cultural național al României.--Accipiter Gentilis Q.(D) 10 decembrie 2021 11:50 (EET) P.S. Chiar are relevanță că e tezaur sau fond, pentru subdiviziunile listelor ? Nu ar putea fi pusă info de genul ăsta la detalii tehnice ? Azi mâine din fond trec în tezaur și poate nu ar strica să fie necesarul de muncă de revizuire setat din timp să fie mai puțin complex.[răspunde]

@Accipiter Gentilis Q. listele trebuie împărțite când devin prea mari pentru MediaWiki. Puteți propune un alt criteriu care să existe la toate obiectele, dar nu sunt foarte multe... Strainu (دسستي‎)  10 decembrie 2021 14:52 (EET)[răspunde]
Pai, na, cum nu ma pricep la detaliile tehnice nu am ce sa propun prea multe, ca se cheama ca imi dau cu parerea asupra unor lucruri de care nu am habar. Oricum, pentru mine e simplu sa tastez fa aia, fa ailalta... Nu ma doare creierul, ca nu le fac io...--Accipiter Gentilis Q.(D) 10 decembrie 2021 16:25 (EET)[răspunde]

Cam asta a fost ce a putut să facă robotul. Am implementat o metodă de reducere graduală a datelor până încap. Asta înseamnă că diferite liste au o cantitate diferită de informații. Articolul principal este Bunuri mobile clasate în patrimoniul cultural național al României.

Mai e o problemă (măricică) la Bunuri mobile din domeniul științele naturii clasate în patrimoniul cultural național al României aflate în municipiul București (tezaur), nu încape în limite orice i-aș face. Va trebui să modific manual tabelul, de exemplu scoțând deținătorul de tot (pentru că e unul singur).--Strainu (دسستي‎)  20 decembrie 2021 10:33 (EET)[răspunde]

Importul imaginilor[modificare sursă]

Imaginile vor fi importate la ro.wp direct din versiunea mare a sursei. Numele fișierului va fi <titlu>_(<domeniu>)_<ordin>_<data>_<categorie>_<cheie>.jpg (de exemplu Pieptene_os_(Arheologie)_3076_21.05.2021_fond_C34B657418444205A3A3E3D4DA913BDF.jpg), unde:

  • <titlu> este titlul lucrării
  • <domeniu> este domeniul lucrării
  • <ordin> este numărul ordinului de clasare
  • <data> este data clasării
  • <categorie> este tezaur sau fond
  • <poziție> este poziția din ordin <cheie> este cheia de identificare a obiectului în baza de date (apare în URL-ul paginii de detalii)

Pagina de descriere a lucrării va conține formatele {{Information}} și {{cc-by-sa-4.0}}, precum și {{FOP Romania}} și {{Imagine liberă în viitor}} dacă autorul este un nume care poate fi identificat în Wikidata ca o persoană cu data decesului după 1 ianuarie 1952, {{tlc}} dacă autorul este gol sau data decesului este înainte de 1 ianuarie 1952, respectiv {{Autor necunoscut}} dacă autorul nu poate fi identificat la Wikidata. Formatul va avea următoarele câmpuri:

  • descriere: conținutul câmpului omonim din pagina de detalii. Dacă există mai multe câmpuri ce conțin cuvântul descriere, atunci vor fi preluate toate, inclusiv numele câmpului (exemplu). Dacă nu există câmpul, va fi copiat câmpul titlu
  • sursa: Legătură către pagina de detalii a obiectului, cu titlul ca text, sau, dacă nu există, textul "Institutul Național al Patrimoniului - Cimec"
  • autor: conținutul câmpului omonim de la sursă, urmat pe o linie nouă de autorul fișei (din considerente de licențiere)
  • data: conținutul câmpului datare, cu toate detaliile de acolo
  • permisiune: textul "Vezi mai jos" cu legătură spre secțiunea de licențiere

Va fi nevoie de ajutor manual pentru clarificarea situației fișierelor marcate cu {{ Autor necunoscut}}. Imaginile vor fi categorisite după domeniu, categorie și județ.--Strainu (دسستي‎)  4 septembrie 2021 01:10 (EEST)[răspunde]

Yes check.svg Realizat--Strainu (دسستي‎)  29 octombrie 2021 00:31 (EEST)[răspunde]
Aici este lista imaginilor care merită analizate pentru a vedea dacă pot fi libere. Strainu (دسستي‎)  29 octombrie 2021 01:02 (EEST)[răspunde]

Crearea de secțiuni dedicate în articolele despre muzee[modificare sursă]

După modelul secțiunilor despre monumente istorice din paginile despre localități, propun realizarea unor secțiuni standard despre exponatele muzeelor care dețin bunuri clasate. Voi realiza acest lucru în faza a doua și voi avea mai multe detalii după ce voi termina importul. Dacă cineva vrea să preia procesul mai devreme, e binevenit(ă).--Strainu (دسستي‎)  4 septembrie 2021 01:10 (EEST)[răspunde]

Am încercat câte ceva si am constatat că o listă "îngroapă" rapid (de la câteva zeci de elemente) orice articol. Nu cred că are sens să facem pagini dedicate, dar am putea experimenta mai departe in două direcții:
  • galerii particularizate când sunt multe exponate
  • ceva text mai mult sau mai puțin legat, atunci când există puține exponate, cu descrieri consistente. Strainu (دسستي‎)  6 decembrie 2021 00:42 (EET)[răspunde]
Secțiunea respectivă poate fi sub forma unui tabel colapsabil cu stare implicită colapsată, care, să includă o subpagină transclusă. Vedeți de exemplu tabelul Distrugătoare și torpiloare participante la raidurile asupra rezervoarelor de petrol de la Constanța Distrugerea instalațiilor industriale petroliere din sudul României în 1916#Preambulul din Dobrogea. Dacă cineva va vrea să-l deschidă, îl va deschide.--Accipiter Gentilis Q.(D) 6 decembrie 2021 15:30 (EET)[răspunde]

Scrierea de articole noi[modificare sursă]

În acest moment nu intenționez să scriu articole noi pe baza acestor date. Dacă acest lucru se va schimba, voi face o cerere diferită. Din nou, dacă cineva mi-o ia înainte, e binevenit(ă). Strainu (دسستي‎)  4 septembrie 2021 01:10 (EEST)[răspunde]

Feedback – artefacte[modificare sursă]

@Strainu: Văd două artefacte majore provocate de importul de imagini:

  1. multe redirect-uri greșite
  2. categorizări stranii precum Categorie:Bunuri mobile clasate în patrimoniul național al României aflate în județul Germania și Categorie:Bunuri mobile clasate în patrimoniul național al României aflate în județul Elveția

//  Gikü  vorbe  fapte  14 octombrie 2021 00:10 (EEST)[răspunde]

Mulțumesc, am corectat categoriile pe care le-am găsit la Special:Categorii dorite.--14 octombrie 2021 15:49 (EEST)
Am corectat și redirecționările, am uitat să anunț.--Strainu (دسستي‎)  17 noiembrie 2021 02:13 (EET)[răspunde]

Liste de localități[modificare sursă]

@Andrei Stroe: Dacă ai apucat să scrii ceva cod, dă un semn.

Aceasta este o cerere de aprobare pentru un robot care să ruleze lunar, nesupravegheat, pentru a popula listele de localități din România, folosind Modul:UATList. Paginile afectate sunt:

În urma discuției anterioare rămăsese doar problema locației listelor. După ce m-am uitat la ce există, am următoarea propunere:

Voi reveni cu exemple pentru județul Argeș și eventuale ajustări ale propunerii după ce scriu codul. Strainu (دسستي‎)  28 decembrie 2021 21:35 (EET)[răspunde]

Începusem mai demult, ieșise ceva-ceva, dar m-am luat cu altele. Aveam aici un început de generator de liste pe bază de Wikidata cum e și cel pentru loturile echipelor de fotbal. Dacă vrei să faci tu altceva, poți eventual să iei query-ul de acolo (dacă nu ai tu deja unul mai potrivit). Din ce am făcut eu, nu se pierde mare lucru. Ideea mea era să existe niște formate pentru fiecare linie de tabel, și era în Modul:UATList ceva de genul ăsta. —Andreidiscuție 29 decembrie 2021 10:41 (EET)[răspunde]
Am implementat listele, le puteți vedea în Format:Listele localităților din România pe județe. Mai e o problemă de ordonare alfabetică (diacriticele vin la sfârșit) dar nu cred că e critică. Strainu (دسستي‎)  25 ianuarie 2022 14:46 (EET)[răspunde]

Revert automat bazat pe ORES[modificare sursă]

Rezumat[modificare sursă]

În ultimii ani, încărcarea patrulatorilor a fost menționată de multe ori ca un bottleneck pentru Wikipedia română (vezi 1, 2 pentru ultimele discuții). Pe de altă parte, filtrele pe baza calității contribuțiilor de la schimbările recente par a fi puțin folosite.

Pentru a reduce încărcarea patrulatorilor, propun să implementez un robot fără flag care să facă revert automat la schimbările nepatrulate și nerevertuite realizate de oameni care au o probabilitate foarte mare să fie distructive.

Detalii ale propunerii[modificare sursă]

Robotul (numit Revertbot PatrocleBot după câinele din Dumbrava minunată) va supraveghea în timp real schimbările recente cerând câte 50 de schimbări din spațiile de nume NS la fiecare X secunde. Va exclude din acestea schimbările patrulate și cele cu eticheta "Revenit". Pentru restul va cere de la ORES scorul pentru modelul damaging. În cazul schimbărilor care au probabilitatea să fie distructive mai mare de Y (0<=Y<=1), va încerca să revină asupra schimbării. În caz de eroare, va ignora problema și va lăsa schimbarea să fie analizată de oameni.

Schimbările vor fi fără flag de robot pentru a putea fi vizibile în schimbările recente și a minimiza conflictele de editare. Numărul de editări va fi relativ redus, probabil câteva zeci pe zi.

Analiză pe schimbările recente din 14 ianuarie 2022[modificare sursă]

Am făcut o analiză pe cele mai recente 5000 de modificări patrulate + 5000 de modificări nepatrulate (în spațiile de nume din secțiunea următoare) și rezultatele sunt în tabelul de mai jos. Modificările sunt din 27 decembrie pentru cele nepatrulate și din 8 ianuarie pentru cele patrulate. Procent revenit înseamnă editări revenite din total, procent din total înseamnă procent din numărul de editări notate de ORES (aka din penultima linie), scor N/A înseamnă că nu există scor ORES. Liniile (în afară de ultima) sunt aditive, adică linia 2 conține și modificările din linia 1 ș.a.m.d.

Câteva concluzii:

  • Există un procent mic (1,5-3%) de revizii care nu apucă să primească un scor ORES în MediaWiki. De cele mai multe ori, el este disponibil din alte surse (apelând direct ORES), deci nu ne afectează
  • Peste 94% din modificările identificate de ORES cu probleme și patrulate sunt anulate, la fiecare categorie de scor, dar doar în jur de jumătate din cele nepatrulate. Asta înseamnă 3 lucruri:
    • ORES e foarte bun spre extrem de bun în a identifica modificările problematice cu pragurile alese de echipă. Asta îmi dă încredere să cobor scorul folosit pentru revert.
    • Până la 25% din totalul editărilor sunt nepatrulate (imposibil de spus pe câte s-a uitat cineva totuși...), lucru confirmat de un query în care am cerut împreună patrulate+nepatrulate și 76% au fost anulate. Putem folosi asta mai târziu pentru a vedea dacă timpul eliberat de robot a fost alocat tot pentru patrulare sau în alte scopuri.
    • Reformulând punctul anterior, doar maxim jumătate din modificările nepatrulate chiar sunt nepatrulate. Trebuie analizat de ce restul nu sunt marcate ca patrulate.
  • Pe Wikipedia română se face revert la 7-8% din totalul editărilor. Nu știu dacă e mult sau puțin.
  • Modificările cu scor ≥0,95 reprezintă doar 0,1% din totalul editârilor analizate și 1,2% din cele anulate. Dacă rămânem la acest prag, robotul nu va avea vreun impact semnificativ asupra efortului de patrulare. Am modificat deci propunerea pentru a începe de la 0,95 și a coborî, dacă nu există prea multe pângeri, cu 0,01/lună până la 0,93. Acest scor ar prinde în jur de 7,5% din editările cu probleme și un pic mai mult de 1% din total. După câteva luni la 0,93 ar trebui făcută o evaluare și văzut cum s-au modificat procentele. Rezultatul ar trebui inclus și în discuția despre interzicerea editărilor prin IP.

Strainu (دسستي‎)  14 ianuarie 2022 00:51 (EET)[răspunde]

Scor Nepatrulate Patrulate
Revenit Total Procent revenit Procent din total Revenit Total Procent revenit Procent din total
≥0,95 4 6 67% 0,12% 3 3 100% 0,06%
≥0,94 8 13 62% 0,26% 7 7 100% 0,14%
≥0,93 19 37 51% 0,74% 17 18 94% 0,37%
≥0,92 41 83 49% 1,66% 33 34 97% 0,70%
≥0,91 71 158 45% 3,16% 54 56 96% 1,16%
≥0 481 5000 10% 100% 264 4846 5% 100%
N/A 0 0 N/A N/A 154 0% 3%

Configurare[modificare sursă]

Configurarea robotului va fi făcută de pe wiki, prin intermediul unei pagini din spațiul de nume MediaWiki. Robotul va detecta schimbările în lista de schimbări recente, iar ca variantă de rezervă, le va citi manual în fiecare noapte.

Următorii parametri vor putea fi configurați:

  • NS - spațiile de nume de urmărit. Implicit: (Articole), Wikipedia, Fișier, MediaWiki, Format
  • X - 10s inițial. Trebuie găsit un echilibru între load (nu vreau nici să ruleze în gol, nici să piardă editări) și latență (dacă întârziem mult, vor face revert patrulatorii și practic robotul nu va ajuta).
  • Y - 0,95 inițial, coborând cu 0,01/lună până la 0,93. Pragul ORES este de 0,909 pentru "foarte probabil cu probleme", cu precizie de 75%. Ideea e să micșorăm pe cât posibil numărul de reveniri greșite, dar să analizăm totuși cât mai multe diff-uri.
  • activ - true/false. Este oprirea de urgență pentru bot. Dacă se schimbă în false, robotul se va opri și nu va mai reporni decât manual.
  • maintainer - inițial Strainu. Un utilizator care să fie notificat în caz de probleme

Detalii tehnice[modificare sursă]

  • permisiuni noi: utilizatorul va avea nevoie de drepturi de patrulare (e nevoie de o excepție de la reguli) pentru a putea face revenirea "oficială", care etichetează corect editarea asupra căreia s-a revenit.
  • Limbaj de programare: Python
  • Sursă: TBD, probabil va fi la https://github.com/rowiki/oresreverter
  • programul va rula permanent, fiind repornit automat în caz de crash
  • monitoring: în caz de eroare detectată, va fi notificat maintainerul prin email sau mesaje pe wiki
  • raportare: săptămânal, robotul va publica un raport ce va conține:
    • numărul de reverturi făcute
    • numărul de schimbări nerevertuite foarte probabil cu probleme (aka cu scorul ORES între 0,909 și Y). Asta ne va permite să reglăm parametrul Y.
    • numărul de erori întâlnite, defalcat conflictele de editare. Asta ne-ar permite să estimăm câte anulări au fost făcute de altcineva.
    • numărul de intervaluri de X sec în care nu s-a întâlnit nicio editare de revertuit. Asta va permite reglarea lui X.

Notificări[modificare sursă]

Taguiesc aici administratorii și patrulatorii pentru a avea o discuție extinsă asupra propunerii: Vali, KlaudiuMihaila, Mihai Andrei, Afil, Rsocol, Andrei Stroe, Firilacroco, Gikü, Ionutzmovie, Victor Blacus, Pafsanias, Dan Mihai Pitea, Alex Nico, NGC 54, AT09W, Accipiter Gentilis Q., Alin, Donarius, Kun Kipcsak, Luciandrei, Miehs, Mishu57, Nyook, Pocor, Polistul, Sîmbotin, Tgeorgescu, Voloh28.

Discuții[modificare sursă]

Comentați mai jos asupra propunerii, inclusiv aprobare explicită dacă sunteți de acord, vă rog. Strainu (دسستي‎)  12 ianuarie 2022 13:14 (EET)[răspunde]

de acord De acord, nu încape discuție. Îmi este neclar totuși cum se analizează modificările potențial distructive și cum se stabilește pragul Y, dar asta ține probabil de altă temă.--Kun Kipcsak (discuție) 12 ianuarie 2022 13:31 (EET)[răspunde]
Kun Kipcsak, clic pe legătura spre ORES din descriere pentru detalii despre softul de analiză.--Strainu (دسستي‎)  12 ianuarie 2022 14:39 (EET)[răspunde]
de acord De acord cu siguranță! Chiar dacă ceva va merge total greșit, putem oricând opri robotul. Însă pe nivel ORES de .95 ne putem baza fără grijă. //  Gikü  vorbe  fapte  12 ianuarie 2022 17:15 (EET)[răspunde]
de acord De acord--Accipiter Gentilis Q.(D) 13 ianuarie 2022 10:37 (EET)[răspunde]
de acord De acord. Ar fi de ajutor, mai ales în cazurile clare, pe care le vede ORES de la o poștă. —Andreidiscuție 13 ianuarie 2022 16:33 (EET)[răspunde]
de acord De acord --Donarius (discuție) 14 ianuarie 2022 19:16 (EET)[răspunde]
de acord De acord. Precizez câteva aspecte:
  • Contul Revertbot a fost creat deja cu mult timp în urmă și probabil este ocupat de altcineva, așa că ar trebui ales alt nume (poate PatrulatorBot?).
  • Spațiile de nume Categorie, Portal și Modul ar trebui luate și ele în considerare de către robot.
  • Orice avertisment acordat de acest robot ar trebui să spună clar utilizatorului avertizat că cel care a judecat editarea este un robot. Pentru editările anulate de robot, dar care au mai puține șanse să fie vandalisme, ar trebui folosit un format special care să spună de ce a fost anulată modificarea (altul decât {{Au-vandalism1}}/{{Au-test1}}). Pe scurt, ar exista două variante de avertizare pentru acest robot: 1. pentru editările care au șanse mari să fie vandalisme {{Au-vandalism1}} cu încă un format care spune că editarea a fost anulată de un robot și ce să facă utilizatorul dacă consideră că editarea sa nu ar trebui anulată și 2. alt format pentru editările care au mai puține șanse să fie vandalisme. --NGC 54 (discuțiecontribuții) 15 ianuarie 2022 02:57 (EET)[răspunde]
Toată ideea robotului este să selecteze doar editările cu șanse foarte mari să fie vandalisme - cele mai rele dintre cele rele. Cred că ar fi mai bine ca în caz de fals-pozitive să procedăm ca la CueBot NG, unde utilizatorii pot să-și șteargă avertizările dacă au reclamat o eroare a robotului. Strainu (دسستي‎)  15 ianuarie 2022 03:14 (EET)[răspunde]

Am modificat în jos pragul de revert propus până la 0,93. Pentru motive, vedeți secțiunea asta.Strainu (دسستي‎)  14 ianuarie 2022 00:51 (EET)[răspunde]

  • Întrebare: Revertbotul va avertiza utilizatorii ale căror editări au fost anulate? --Pafsanias (discuție) 14 ianuarie 2022 10:52 (EET)[răspunde]
Bună întrebare ! Teoretic revertul v-a fi semnalat la "Alertele dumneavoastră", dar, cu siguranță ar fi util un text explicativ scurt care să includă un link spre o listă de patrulatori/administratori (de preferință activi în ultima lună, dacă ea poate fi actualizată automat). Scopul ar fi ca editorul să poată apela în mod direct la cineva uman, pentru a-i putea evalua, la nevoie, editarea. Cu această ocazie, va exista în pagină și un fel de format care va avertiza pe oricine consideră că este cazul, că acel cont/IP a făcut în trecut editări potențial cu probleme. În perspectivă, în felul ăsta ar putea poate fi coborât, în viitor și mai jos pragul.--Accipiter Gentilis Q.(D) 14 ianuarie 2022 11:21 (EET)[răspunde]
Pun un draft de text: Modificarea dv. asupra paginii NumePagină din XX YY ZZZZ aa:bb [dată oră] a fost înlăturată de către un sistem de detecție, analiză și gestiune automată a editărilor, dat fiind că i s-a atribuit un scor de risc nefavorabil. Puteți solicita reanalizarea ei [[Wikipedia:NumeListă|de către un operator uman]] accesând [[link]].--SemnăturăBot--Accipiter Gentilis Q.(D) 14 ianuarie 2022 11:31 (EET) P.S. Eventual, în loc de Modificarea dv. asupra paginii NumePagină din XX YY ZZZZ aa:bb [dată oră] poate fi scris [link diff O modificare recentă a dv.][răspunde]
Aici vorbim de cele mai evidente vandalisme, se pot folosi avertizările standard ({{au-vandalism1}}...), plus un alineat suplimentar care să trimită undeva pentru review. Cred că unii colegi sunt interesați ca numărul de pătrățele să fie cel corect. Nu pot garanta acest lucru, sunt prea multe scenarii posibile, dar pot folosi ultimul avertisment din pagină în momentul citirii. Strainu (دسستي‎)  14 ianuarie 2022 12:08 (EET)[răspunde]
Personal, mai importantă decât numărul de pătrățele mi se pare evitarea îndepărtării unui potențial contributor pozitiv. Faptul că textul postat netezește calea spre acceptarea revertului ca ceva care nu este non-friendly de către cineva bine intenționat, fie el și 1 din 10 cazuri, mi se pare un lucru important. Oricum o pagină cu multe marcaje de revert automat va fi pagina unui cont sau Ip potențial problematic și nu văd ce trebuie să stau să mai și număr pătrățelele, în acest caz. Bănui că, cel puțin teoretic, poate fi setat botul ca în caz că există un număr mai mare de reverturi decât Y în unitatea de timp X, să pună un flag suplimentar necesitând atenția unui administrator pentru a evalua o potențială blocare, sau, poate fi eventual setat să blocheze temporar Ip-ul/contul pentru 24 de ore și să trimită cazul la evaluarea unui operator uman.Habar nu am dacă e posibil sau nu sau dacă e indicat sau nu. Doar ridic problema la fileu.--Accipiter Gentilis Q.(D) 14 ianuarie 2022 15:08 (EET)[răspunde]
@Accipiter Gentilis Q.: Ar trebui să fie posibil ca robotul să poată raporta utilizatori, căci la en.wp, ClueBot NG raportează (cel mai recent exemplu). Pentru a putea bloca, ar trebui să fie administrator la fel ca ST47ProxyBot (grupuri | blocări efectuate) de la en.wp. --NGC 54 (discuțiecontribuții) 15 ianuarie 2022 03:18 (EET)[răspunde]

Am făcut un grant request ce acoperă și acest proiect m:Grants:Project/Rapid/Strainu/Enhance and secure the future of Romanian projects' critical infrastructure.--Strainu (دسستي‎)  4 februarie 2022 14:33 (EET)[răspunde]

Rapoarte de progres[modificare sursă]

2022-03-23

Am rulat azi-noapte o versiune simplificată de robot, care doar printează editările ce depășesc pragul. Citirea din configul de pe wiki merge OK, la fel și API-ul MW și ORES. A devenit evident foarte repede că intervalul de 10s e mult prea mic, mai ales noaptea, așa că am făcut un algoritm în care timpul poate varia între un min și un max, momentan 10s și 60s.

Pașii următori: crearea unui raport de rulare pe wiki, care să fie actualizat zilnic. Mă voi mai juca cu pragul de revert pentru a putea testa diferite funcționalități, dar deocamdată nu voi face reverturi.--Strainu (دسستي‎)  23 martie 2022 12:39 (EET)[răspunde]

2022-03-25

Rapoartele robotului pot fi văzute la Utilizator:PatrocleBot/Rapoarte. Am făcut de asemenea și un revert de probă în articolul Kung Fu. Chiar dacă nu e clar distructiv, eu aș fi făcut revert la acea schimbare. Ce am aflat în urma testelor e că o cerere de 5000 de schimbări recente nepatrulate acoperă ultimele 30 de zile (intervalul maxim în care sunt date). Putem folosi asta pentru a mai curăța din editările nepatrulate.

Următorul pas e modulul de avertizare a utilizatorilor.--Strainu (دسستي‎)  25 martie 2022 22:27 (EET)[răspunde]

Fain! Mi se pare o direcție mai eficientă decât cea despre interzicerea contribuțiilor anonime. Poate că se poate jongla un pic diferențiat cu contribuțiile anonime, în sensul unor praguri diferențiate între clasele de contributori (anonimi sau nu, etc....). Oricum Ores poate atribui un scor de risc diferit, cred, dar poate se poate modula și altfel. Nu mă pricep, doar ridic problema la fileu.--Accipiter Gentilis Q.(D) 31 martie 2022 19:01 (EEST)[răspunde]
De ce considerați aceste două propuneri antagoniste? --Pafsanias (discuție) 31 martie 2022 20:34 (EEST)[răspunde]
De unde rezultă că le consider astfel? Nu mi se pare că ar avea caracter antagonic. Consider doar că soluția propusă de Strainu are o eficiență superioară și efecte adverse mai mici. --Accipiter Gentilis Q.(D) 31 martie 2022 22:56 (EEST)[răspunde]
Din mesajul de mai sus și cel de la Cafenea. Dacă nu sunt antagoniste, înseamnă că pot fi implementate în paralel. --Pafsanias (discuție) 31 martie 2022 23:08 (EEST)[răspunde]
Pot fi, dar rămâne de văzut dacă totalul efectelor adverse ale implementării în paralel, a ambelor inițiative, nu depășește simpla sumă a acestora. Sunt tentat să afirm că totalul ar fi mai mare decât simpla sumă, motiv pentru care am tendința de a fi contra adoptării inițiativei de interzicere a editării de pe IP. Deocamdată însă nu afirm că sunt împotriva inițiativei menționate, ci doar că estimez că va avea efecte adverse mai mari și că, a o combina cu inițiativa lui Strainu are potențialul de genera efecte adverse mai mari, decât simpla sumă generată de adoptarea fiecăreai dintre inițiative, în parte. Rezumând: apreciez ca fiind cea mai eficientă în materie de efecte pozitive și cea mai benignă în materie de efecte negative propunerea lui Strainu și tind să fiu critic în ce privește asocierea celor două inițiative. --Accipiter Gentilis Q.(D) 2 aprilie 2022 12:54 (EEST)[răspunde]
Nu prea văd cum obligativitatea înregistrării unui cont ar putea potența efectele negative ale prezentei inițiative, dar poate că există estimări statistice și probabiliste pe care nu le cunosc. Ce „efecte adverse” aveți în vedere concret? --Pafsanias (discuție) 4 aprilie 2022 11:42 (EEST)[răspunde]
Problema diferențierii între utilizatori e spinoasă. Teoretic ar trebui să dea aceleași rezultate indiferent de utilizator. Practic, e cunoscut faptul că ORES e părtinitor (în sens negativ) față de anonimi, deci o editare similară ar obține un scor mai mare dacă ar fi făcută de un anonim. Nu am studiat suficient modelul încât să explic asta, dar ideea e că o asemenea decizie ar fi doar un gest de bunăvoință față de cei care și-au petrecut timpul cu crearea unui cont.--Strainu (دسستي‎)  1 aprilie 2022 00:01 (EEST)[răspunde]
2022-03-31

PatrocleBot rulează nesupravegheat! Am pornit o rulare pe toolserver, ceea ce ar trebui să ofere o latență mai mică față de o rulare locală. Este implementat și modulul de avertizare a utilizatorilor, însă mă aștept să mai facă probleme din când în când. Reverturile nu sunt marcate ca fiind făcute de un robot, mesajele și rapoartele însă da. Lăsați-mi un mesaj dacă observați vreo problemă.

Următorul pas este îmbunătățirea codului în așa fel încât să nu crape, orice-ar fi. De asemenea, aș vrea să investighez cât de utilă ar fi parcurgerea tuturor editărilor din SR, nu numai a celor mai recente dintr-un articol. Ideea inițială era că rulând la intervale mici de timp vom prinde toate editările, dar după ce-am implementat acel interval variabil acest lucru nu mai e neapărat adevărat.--Strainu (دسستي‎)  1 aprilie 2022 00:01 (EEST)[răspunde]

2022-04-02

Am coborât temporar pragul la 0,93 pentru a testa mai multe componente din robot. Am reparat componenta de avertizare a utilizatorilor și am făcut să se afișeze datele din raport în fusul orar al site-ului. Din cele 10 reverturi făcute astăzi (cu pragul 0,93 cu care intenționez să îl rulez în final), au fost 2 care erau de fapt corecte și încă una asupra căreia aș fi revenit deși era parțial corectă. Cele două reverturi cu scor peste 0,94 sunt ambele corecte. Acum urmează (sper) o săptămână de rulare neîntreruptă cu pragul la 0,95. E posibil să nu facă nicio revenire, pentru că scorurile astea sunt rare, caz în care îl voi lăsa până la prima revenire.--Strainu (دسستي‎)  2 aprilie 2022 01:26 (EEST)[răspunde]

@Strainu: Special:Diff/14864881: Sună mai natural „vandalism la” în loc de „vandalism în” și ar fi putut exista o legătură către Kamienna Góra. Și nu ar trebui adăugat după avertisment un mesaj suplimentar care să specifice faptul că un robot a anulat editarea și a avertizat utilizatorul? Poate ceva în stilul {{SharedIPAdvice}}. Un astfel de mesaj ar fi util în cazul în care editarea era de fapt constructivă; în felul acesta, utilizatorului avertizat îi s-ar da de înțeles că nimeni nu are nimic „personal” cu el. Este doar o sugestie... --NGC 54 (discuțiecontribuții) 2 aprilie 2022 03:23 (EEST)[răspunde]
Yap... Ar fi o bună idee.--Accipiter Gentilis Q.(D) 2 aprilie 2022 08:49 (EEST)[răspunde]
Am formulat așa pentru că am și un caz de eroare. Când sunt probleme cu obținerea numelui articolului, mesajul va fi "vandalism în Wikipedia". Mă mai gândesc la formulare. Ok pentru legătură și mesajul suplimentar. Strainu (دسستي‎)  2 aprilie 2022 10:07 (EEST)[răspunde]
Observ că a mai făcut și Gikü un revert la una din modificările robotului. Eu unul aș fi revenit asupra schimbării, dar e important să notăm cazurile astea pentru a evalua unde trebuie pusă limita. Strainu (دسستي‎)  2 aprilie 2022 10:52 (EEST)[răspunde]
2022-04-06

Am implementat modificările propuse mai sus (exemplu: Discuție_Utilizator:46.97.176.241) și am reluat rularea cu un prag de 0.94. Un lucru interesant observat e că, fiind făcut foarte rapid, vandalii mai revin. Voi pune robotul să urmărească articolele pe care s-a făcut revert și să facă revert la modificările aceluiași user chiar dacă scorul e mai mic decât pragul configurat, dar mai mare decât pragul ORES pentru "foarte probabil cu probleme" (e.g. 0,909<=scor<=0,93)--Strainu (دسستي‎)  6 aprilie 2022 19:09 (EEST)[răspunde]

2022-04-13

Robotul rulează acum în clusterul de Kubernetes al toolforge, cu configurația pe care o propusesem inițial ca finală. Articolele pe care s-a făcut o revenire sunt urmărite timp de 2 ore și se face revert mai agresiv la alte contribuții ale aceluiași utilizator. Pasul următor e să documentez ce face robotul în timp ce el colectează timp de rulare.

Ce am observat urmărind reverturile făcute e că pe măsură ce coborâm scorul analizei (fie pentru revertul inițial, fie pentru etapa de urmărire) devine important și scorul de goodfaith, care indică dacă schimbare a fost problematică intenționat. Mai e nevoie de ceva analiză asupra valorilor, dar ideea e că putem fi mai agresivi dacă și scorul de goodfaith e mic. Acest comentariu nesemnat a fost adăugat de Strainu (discuție • contribuții) la 13 aprilie 2022 01:25.

@Strainu: Nu este posibil ca PatrocleBot să folosească și {{Au-ștergeri1}} etc.? --NGC 54 (discuțiecontribuții) 13 aprilie 2022 13:36 (EEST)[răspunde]
În ce situații credeți că ar trebui folosit acest format? Strainu (دسستي‎)  13 aprilie 2022 17:27 (EEST)[răspunde]
@Strainu: De exemplu, PatrocleBot analizează și anulează o editare. Editarea respectivă constă într-o ștergere masivă de text. PatrocleBot acordă vandalului {{Au-ștergeri1}}. Este posibil din punct de vedere tehnic? --NGC 54 (discuțiecontribuții) 13 aprilie 2022 21:36 (EEST)[răspunde]
Orice e posibil tehnic. Partea grea e să definim ce înseamnă ștergere masivă: e un procent, un număr de octeți? Și ce se întâmplă dacă s-au șters și s-au adăugat cantități mari de text în aceeași schimbare, cu diferența rezultată peste pragul decis? Strainu (دسستي‎)  13 aprilie 2022 22:52 (EEST)[răspunde]
@Strainu: „Raportați aici.”: Legătura duce către WP:AA. Poate ar trebui înlocuită (nu știu cu ce pagină, poate cu Discuție Utilizator:PatrocleBot, Wikipedia:Cafenea sau o pagină în stilul Wikipedia:Filtrarea modificărilor/Erori?), căci unele discuții se desfășoară la WP:AA tocmai pentru acolo este mai multă „liniște”, spre deosebire de Cafenea, unde șansele ca un troll sau un vandal să intervină sunt mai mari; legătura actuală ar putea duce în viitor la aglomerarea Afișierului. Iar raportările de utilizatori, precum asta, ar trebui făcute la WP:REC. --NGC 54 (discuțiecontribuții) 20 aprilie 2022 00:44 (EEST)[răspunde]
Nu cred că trebuie schimbată destinația. Evaluarea automată funcționează corect, dacă utilizatorul consideră că o modificare nu e vandalism e nevoie de un utilizator cu experiență pentru a evalua editarea respectivă. Nu intenționez să preiau eu acel rol, iar la Cafenea sunt șanse mari ca mesajul să se piardă printre discuțiile de rutină de acolo. În schimb AA e urmărit și de toți patrulatorii, deci e locația perfectă pentru așa ceva. Dacă se va aglomera, ne putem gândi la o pagină dedicată, dar la numărul de reverturi făcute e improbabil.
O să mut raportările de utilizatori, deși cred că mai util ar fi ca ele să fie făcute fără flag pentru a fi văzute în SR. Strainu (دسستي‎)  20 aprilie 2022 13:32 (EEST)[răspunde]
2022-05-02

Câteva zile robotul nu a funcționat din cauză că nu mai era logat. Am încercat un fix, sper să fie OK. Am implementat și schimbările discutate mai sus și urmează câteva îmbunătățiri:

  • în cazul în care vandalul e singurul autor, revertul eșuează. Va anunța la WP:REC aceste situații.
  • voi încerca niște reveniri și pe baza scorului goodfaith (bună credință). Mai întâi dacă și scorul damaging și badfaith (inversul lui goodfaith) sunt în "very likely", apoi mă mai întind și încerc combinații cu un scor likely si celălalt very likely (limitele pot fi găsite în MediaWiki:Revertbot.json)

Din păcate se pare că toate revenirile sunt pe anonimi. Nu e o greșeală, așa sunt scorurile întoarse de ORES, doar 1-2% din toate schimbările "posibil distructive" sunt făcute de utilizatori autentificați. Am logat phab:T307317 pentru asta, să vedem dacă primesc vreo sugestie, însă tare mi-e teamă că e vorba de bias în felul cum am antrenat rețeaua neurală.

Aș vrea să știu și ce părere au patrulatorii despre PatrocleBot până acum? Vă ajută, se simte reducerea numărului de pagini de analizat?--Strainu (دسستي‎)  2 mai 2022 02:19 (EEST)[răspunde]

Mie mi se pare că ajută, în mod destul de evident.--Accipiter Gentilis Q.(D) 7 mai 2022 23:40 (EEST)[răspunde]
2022-05-04

Am început să revin asupra tuturor modificărilor foarte probabil dăunătoare și foarte probabil de rea credință. E în continuare un număr mic de editări, dar voi mai rafina procesul prin diverse combinații între scorurile ores și perioada de urmărire a utilizatorului și a paginii.

Trebuie investigate mai in detaliu editările de ieri de la Bor (element), pentru că în viitor robotul să poată reveni asupra tuturor acelor editări.

Am observat și o problemă de plasare a mesajelor la reclamații pe care o voi rezolva în următoarea iteratie. Strainu (دسستي‎)  4 mai 2022 02:28 (EEST)[răspunde]

2022-05-07

Astăzi a fost cea mai agitată zi de când am pornit robotul. Partea bună e că a identificat corect ca distructive editările din campania dublajelor, din păcate încă mai erau probleme cu avertismentele. Le-am rezolvat, împreună cu plasarea reclamațiilor unde trebuie.

Trebuie văzut ce putem face cu articolele create de un singur utilizator. Nu le-aș marca cu {{șr}} pentru că articolul ar putea fi salvat. Pe de altă parte, prea multe reclamații vor crea alte probleme. Bănuiesc că și să le las pentru procesul normal de patrulare e o optiune. Păreri aici?--Strainu (دسستي‎)  7 mai 2022 23:33 (EEST)[răspunde]

@Strainu: La Utilizator:PatrocleBot/Rapoarte văd „Editări cu probleme neanulate”. De ce există editări pe care PatrocleBot le-a identificat ca fiind cu probleme, dar nu le-a anulat? Aveau un scor ORES mult prea scăzut? Unde pot vedea care sunt acele editări? --NGC 54 (discuțiecontribuții) 25 mai 2022 21:23 (EEST)[răspunde]
Da, acele editări au un scor ORES "damaging" cuprins între 0.909 și 0.93 și un scor "goodfaith" mai mare de 0.07 (vezi MediaWiki:Revertbot.json și raportul de progres din 2 mai). Am experimentat și cu setări mai agresive, dar nu mi-a plăcut rezultatul (vezi mai jos). Având în vedere că toate editările cu scor > 0.93 sunt oricum anulate, cele rămase pot fi găsite la schimbări recente cu filtrele astea: [12]. Strainu (دسستي‎)  25 mai 2022 21:33 (EEST)[răspunde]
2022-05-25

Robotul rulează fără probleme de mai multe săptămâni, făcând revert la 2-3% din totalul editărilor nepatrulate, adică <1% din editările totale (vede cam 400 de editări pe zi, iar media totală fără roboți e de 1500 editări [13]). Din păcate testele făcute arată că o setare mai agresivă pe partea de revert va duce la multe anulări greșite, așa că cel mai potrivit e să lăsăm numerele așa. În schimb, ce putem face este să marcăm ca patrulate schimbările de la capătul celălalt al spectrului de note (foarte probabil bune, foarte probabil bine intenționate).

2022-05-26

Patrulări efectuate: [14]--Strainu (دسستي‎)  26 mai 2022 22:13 (EEST)[răspunde]

Completarea citărilor[modificare sursă]

În urma acestei discuții, Andrebot rulează zilnic pentru a completa citările date doar prin URL. Încearcă asta pentru toate notele din articolele modificate de la rularea anterioară, indiferent dacă notele respective au fost introduse acum sau mai demult.

Inițial m-am bazat doar pe taguri OGP și Citoid, dar nu mi-a plăcut ce ieșea la unele site-uri frecvent citate (anume IMDb, YouTube și Google Books). Acum am făcut niște tratări separate pentru acestea trei, folosind API-urile REST puse la dispoziție de site-urile respective (Google pare destul de liber cu permisiunea de utilizare a API-urilor, dar IMDb permite în varianta free doar 500 de interogări pe lună — sper să ne încadrăm, cred că e ok). Ca de obicei, mă uit periodic peste editările robotului și încerc să văd dacă mai sunt probleme. Mă puteți trage de mânecă dacă vedeți ceva. —Andreidiscuție 1 februarie 2022 23:01 (EET)[răspunde]

Andrei Stroe, poate te interesează și [15]. Am făcut un translator pentru profit.ro so far care extrage autorul. Strainu (دسستي‎)  4 aprilie 2022 20:19 (EEST)[răspunde]

Legături interne eronate[modificare sursă]

Poate un robot să corecteze sutele de legături interne eronate pe care le-am semnalat pe pagina Discuție:Ofițer? Se pot corecta și manual, dar mi se pare un volum prea mare de muncă. --Bătrânul (discuție) 3 aprilie 2022 18:03 (EEST)[răspunde]

Există o anumită reticență în a face dezambiguizări nesupravegheate; știu însă că exista un script de dezambiguizare automată undeva, dar nu-l mai găsesc. Strainu (دسستي‎)  4 aprilie 2022 13:03 (EEST)[răspunde]
Răul a fost făcut deja. Dacă respectivul utilizator făcea numai redenumirea de la Ofițer la Ofițer de armată era OK din punct de vedere al legăturilor interne. Putea apoi să creeze pagina Ofițer (dezambiguizare), având conținutul actual al paginii Ofițer. --Bătrânul (discuție) 4 aprilie 2022 18:43 (EEST)[răspunde]