bot que desa els tuts públics dels usuaris d'un servidor Mastodon que s'hi donin d'alta per a poder alimentar amb frases en #català diversos projectes lingüístics com ara Common Voice
Anar al arxiu
2022-12-08 17:29:12 +01:00
corpus.py Procés d'alta en dos passos 2022-12-02 17:46:07 +01:00
database.py Procés d'alta en dos passos 2022-12-02 17:46:07 +01:00
LICENSE Primera versió de Corpus! 2022-12-01 17:34:13 +01:00
mastodonbot.py Procés d'alta en dos passos 2022-12-02 17:46:07 +01:00
README.md Actualitzat 2022-12-02 18:59:52 +01:00
requeriments.txt Primera versió de Corpus! 2022-12-01 17:34:13 +01:00
test.txt creat 2022-12-08 17:29:03 +01:00

Corpus

Aquest bot desa els missatges públics dels usuaris d'un servidor Mastodon que s´hi donin d'alta. En qualsevol moment poden donar-se de baixa.

Al demanar l'alta en aquest bot, es pregunta a l'usuari confirmació de majoria d'edat, si accepta cedir a aquest projecte Corpus tots els seus tuts públics sota llicència CC0 i sí els tuts que escrigui no seran copies dels escrits per algú altre.
Al confirmar-ho tot, l'usuari permet alimentar amb frases escrites en català projectes lingüístics com per exemple Common Voice.

En el cas del bot corpus de mastodont.cat, els tuts públics desats es pujaran de manera periòdica i anonimitzada a aquest repositori.

Com donar-se d'alta o de baixa

Demanar-ho al bot, mencionant-lo:

@bot alta
@bot baixa

Tots els usuaris donats d'alta poden esborrar quan ho desitgin tots els missatges que el bot tingui desats:

@bot esborra

Com instal·lar aquest bot

Dependències

  • Python 3
  • Servidor Postgresql
  • Un compte Mastodon per aquest bot

Dins del entorn virtual Python:

  1. Executar pip install -r requirements.txt per a instal·lar les llibreries necessàries.

  2. Executar python corpus.py per a fer la configuració inicial del bot de Mastodon i per a crear la base de dades Postgresql on desar els missatges públics.

  3. Configurar cron per a que executi python corpus.py cada minut.