Subir archivos a 'utils'
This commit is contained in:
pare
547bb90ced
commit
f19e452d56
S'han modificat 1 arxius amb 443 adicions i 0 eliminacions
443
utils/bot_plus_etiquetes.php
Normal file
443
utils/bot_plus_etiquetes.php
Normal file
|
@ -0,0 +1,443 @@
|
||||||
|
<?php
|
||||||
|
// funció per afegir etiquetes
|
||||||
|
|
||||||
|
function MstEtiquetes($rsst_ara) {
|
||||||
|
if ( is_string($rsst_ara) ) {
|
||||||
|
// echo "es una cadena\n";
|
||||||
|
//$log -> lwrite ("es una cadena.");
|
||||||
|
// echo $rsst_ara."\n";
|
||||||
|
// neteje la cadena de caracters especials
|
||||||
|
// primer lletres accentuades i ç
|
||||||
|
$patro = array("'é'", "'è'", "'ë'", "'ê'", "'É'", "'È'", "'Ë'", "'Ê'", "'á'", "'à'", "'ä'", "'â'", "'å'", "'Á'", "'À'", "'Ä'", "'Â'", "'Å'",
|
||||||
|
"'ó'", "'ò'", "'ö'", "'ô'", "'Ó'", "'Ò'", "'Ö'", "'Ô'", "'í'", "'ì'", "'ï'", "'î'", "'Í'", "'Ì'", "'Ï'", "'Î'", "'ú'",
|
||||||
|
"'ù'", "'ü'", "'û'", "'Ú'", "'Ù'", "'Ü'", "'Û'", "'ý'", "'ÿ'", "'Ý'", "'ø'", "'Ø'", "'œ'", "'Œ'", "'Æ'", "'ç'", "'Ç'");
|
||||||
|
$subst = array('e', 'e', 'e', 'e', 'E', 'E', 'E', 'E', 'a', 'a', 'a', 'a', 'a', 'A', 'A', 'A', 'A', 'A', 'o', 'o', 'o', 'o',
|
||||||
|
'O', 'O', 'O', 'O', 'i', 'i', 'ï', 'I', 'I', 'I', 'I', 'I', 'u', 'u', 'u', 'u', 'U', 'U', 'U', 'U', 'y', 'y', 'Y', 'o', 'O', 'a', 'A', 'A', 'ç', 'Ç');
|
||||||
|
// $rsst_ara_n = preg_replace($patro, $subst, $rsst_ara);
|
||||||
|
$rsst_ara_n = str_replace($patro, $subst, $rsst_ara);
|
||||||
|
// $rsst_ara_n = strtr($rsst_ara, $patro, $subst);
|
||||||
|
// aqui de la resta (tot el que no siga vocals i nombres)
|
||||||
|
// $rsst_ara = preg_replace('/[^A-Za-z0-9\-]/',' ',$rsst_ara_n);
|
||||||
|
$rsst_ara = str_replace('/[^A-Za-z0-9\-]/',' ',$rsst_ara_n);
|
||||||
|
// $rsst_ara = strtr($rsst_ara,'/[^A-Za-z0-9\-]/',' ');
|
||||||
|
// echo $rsst_ara."\n";
|
||||||
|
|
||||||
|
// if(preg_match("/(Sibilla|teatr[eals]+|dramatu[rgia]+|musica[ls]|danca[ire]+|ball[arines]+|pint[ou]r[aes]|escript[oras]+|muse[usistcques]+|etnologi[caques]+|film|pellicula)/i", $rsst_ara)){
|
||||||
|
// if(preg_match("/(compositor|simfoni[ca]*|musica|teatre|pint[ou]r|film|pellicules)/i", $rsst_ara)){
|
||||||
|
if(preg_match("/(cultura|centre\scultural)/i", $rsst_ara)){
|
||||||
|
// if(preg_match("/(Les\sArts|ballari[nas]*|centre\scultural|capital[s]*\scultural[s]*|humorist|actriu|actor|escultor[a]*|escenari|escriptor|exposicio|compositor|simfoni[ca]*|musica|teatre|pint[ou]r|film|pellicules|museu|comedia|Nino\sBravo)/i", $rsst_ara)){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Cultura";
|
||||||
|
if(preg_match("/(disc|compositor|simfoni[ca]|musica[ls]|gira|grup|concert)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Cultura #Música";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(escenari|teatre|teatrals|dramaturg|escena|Rambleta)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Cultura #Teatre";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(escriptor[aesor]*|novel·la|litera[ritua])/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Cultura #Literatura";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(pint[urao]+|quadres|galeria|Sorolla)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Cultura #Pintura";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(ball[rinase]+|dança)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!Treball)/i", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#Cultura #Dança";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(cine|pel·licula|Filmoteca|Guerra\sde\sles\sGalaxies|rodatge|audiovisual|curtmetratge)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Cinema";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(moros\si\cristians|ninot|lofrena|La\sMagdalena|Lechuguina|festes|festes\sfundacionals|romeria|mascleta[es]*|focs\artificials|carnestoltes|gaiat[esra]+|falle[ares]+|fogueres\sdAlacant|bellesa\sdel\sfoc|artist[aes]+\sfaller[s]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Festes";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(mor[t]*)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!amor|moros\si\cristians)/i", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#Cultura #Necrològica";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(animals|porc[s]*\ssenglar[s]*|biodiversitat|biosfera|ecologi[aictes]+)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#MediAmbient";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(Setmana\sSanta|processo|Tamborada|Diumenge\sde\sRams)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!useres|processos)/i", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#SetmanaSanta";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Pentagon|caça|missil|atac|guerra|batalla|atac|tropes|alto\sel\foc|treva|dron|avio|pilot)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Món #Guerra";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Volkswagen|gigafactoria)/", $rsst_ara)) {
|
||||||
|
$etiqueta = "#Economia";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(agricultura|biosfera|ecosistema)/i", $rsst_ara)) {
|
||||||
|
$etiqueta = "#MediAmbient";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(mon[aes]+|Pasqua)/i", $rsst_ara)) {
|
||||||
|
$etiqueta = "#Pasqua";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
// elseif(preg_match("/(llibertat\sdexpressio|parc\scientific|accidents\slaborals|planta\ssolar|desnon[enmta]+|despoblament|xef|rebaixe|turis[metas]|carreter[aes]|energia|cava|identitat|digital|llengua|castella[noparlts]|arquebisb[eat]+)/i", $rsst_ara)){
|
||||||
|
elseif((preg_match("/(societat)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!real)/", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#Societat";
|
||||||
|
|
||||||
|
if(preg_match("/(dependencia|dependents)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Societat #Dependència";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(voltor|conservacionista|ecologic|ecologiques|vegetacio)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Societat #Ecologia";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(hotel|turis[metas]+|estranger)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!vehicle|automobil)/i" ,$rsst_ara)) ){
|
||||||
|
$etiqueta = "#Societat #Turisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(bous|tauri[aens]|animal[s]*)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Societat #MaltractamentAnimal";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(renovables|eolic|planta\ssolar|fotovoltai[cques]+)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Societat #Energia";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(TSJ[CV]*|Tribunal|judici|condema)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Tribunals";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(pastera)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Immigració";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(microplastic|animals|porc[s]*\ssenglar[s]*|biodiversitat|biosfera|ecologi[aictes]+)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#MediAmbient";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(cos\ssense\svida|detenen|detingut|criminal|abatut[s]*|estaf[aes]+|naufragi|rescat[entads]*|estaf[aen]+|danys\spersonals|violen[ciatment]|apunyala[atd]|exparella|atracador[s]\sde\sbanc|violencia\sde\sgenere|allau|atropell[adt]+|segrest[ador]|mor[tairen]+|autopsi[aes]|cadaver[s]|mata|assassi[nsat]|detingu[tsdea]|polici[alse]|robatori[s]|accident|sinistre|atracament[sdora]|feri[tsdesa]+|homicidi|preso[nera]|violad[arcio]|incendi|traficar)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!Moraig)/", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#Successos";
|
||||||
|
if(preg_match("/(incendi[s]*\sforestal[s]*)/", $rsst_ara)) {
|
||||||
|
$etiqueta = "#Successos #MediAmbient";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(violar|sexual[ment]*|abus[ar]*\ssexual[ment]*|exparella|masclis[meta]|violencia\sde\sgenere|don[aes]+\sassassinad[aes]+|agressio|prostitu[ciobulta])/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos #Masclisme";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Parkinson|autisme|fer\esport|oncologi|leucemia|cancer|diagnostic|fibrosi|encefalitis|cancer\sde|Parkinson|pediatr[aes]+|vacuna[cio]*|respiratori|grip|estreptococ|bronquiolitis|pandemia|malaltia|covid|neumonia|hospital[itz]*|sanita[tri]+|salut|infecci[ons]+)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Salut";
|
||||||
|
if(preg_match("/(pandemia|covid|endemia)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Sanitat #Salut";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(abus\ssexual|exparella|masclis[meta]|violencia\sde\sgenere|don[aes]+\sassassinad[aes]+|agressio|prostitu[ciobulta])/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos #Masclisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(xef|cuin[aer]*|aliment)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Societat #Gastronomia";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(ERTO|ERO|plantilla|treballadors)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Treball";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Tik\sTok|Instagram|Facebook|Twitter|Whatsapp|Linkedin|app[s]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Xarxes";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(condemna|Audiencia\sNacional|Fiscalia|TC|Tribunal|sentenci[aes]+|cassaci|CGPJ|Constitucional[s]*)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Tribunals";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(fosses\scomunes|victimes\sdel\sfranquisme|memoria\sdemocratics|Guerra\sCivil|franquisme)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#MemòriaHistòrica";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(bunyols|La\sMagdalena|Lechuguina|festes|festes\sfundacionals|romeria|mascleta|focs\artificials|carnestoltes|gaiat[esra]+|falles|faller[a]*|fogueres\sdAlacant|bellesa\sdel\sfoc)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Festes";
|
||||||
|
if(preg_match("/(agressio|homofob|ferit|insult)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Festes #Successos";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(Setmana\sSanta|processo|Tamborada)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!processos)/", $rsst_ara)) ){
|
||||||
|
$etiqueta = "#SetmanaSanta";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/([Pp]asqua)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Pasqua";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(8M|Llei\sde\sIgualtat|LGTBI|8\sde\sMarç)/i", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!28M)/", $rsst_ara)) ){
|
||||||
|
$etiqueta = "#Feminisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(incendi|accident|robatori|furtar|policia|Guardia\sCivil)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos";
|
||||||
|
if(preg_match("/(violar|sexual[ment]*|abus[ar]*\ssexual[ment]*|exparella|masclis[meta]|violencia\sde\sgenere|don[aes]+\sassassinad[aes]+|agressio|prostitu[ciobulta])/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos #Masclisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(agressio|homofob|ferit|insult)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos #Homofòbia";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(oratge|llamp|hivern|primaver[als]+|estiu|tardor|nuvo[ls]+|calo[rsad]+|plu[jages]+|boir[aes]+|tempest[aes]+|neva[rtdaes]*|tronad[aes]+|pedregad[aes]+|grani[sda]+|ponent[ada]*|mestral|temperatur[aes]+)/i", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!manifestacio|Amazon|computa[ciodr]+)/", $rsst_ara)) ){
|
||||||
|
$etiqueta = "#Oratge";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(28M|campanya\selectoral|eleccions|candidat[uraes]*|precampanya|programa\selectoral|votacio|electoral)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Eleccions28M";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Volkswagen|gigafactoria)/", $rsst_ara)) {
|
||||||
|
$etiqueta = "#Economia #Societat";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(porc[s]*\ssenglar[s]*|agricultors|incendi[s]*\sforestal[s]*)/", $rsst_ara)) {
|
||||||
|
$etiqueta = "#MediAmbient";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Alacant[inaes]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Alacant";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Castello[necs]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Castelló";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Valencia[nse]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#València";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(Generalitat|Consell[eras]*|Corts|[Pp]arlamen[taries]+)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/( ?!morada|formacio )/", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#Consell";
|
||||||
|
if(preg_match("/(Catalunya|catala[na]*|Ponsati|Puigdemont|Borras)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Catalunya";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(politica)/i", $rsst_ara)){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Política";
|
||||||
|
if(preg_match("/(Per[uanse]+|internacional[s]*|EUA|Afganhistan|Russia|Iran|Marroc)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Món";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Audiencia\sNacional|Fiscalia|TC|Tribunal|sentenci[aes]+|cassaci|CGPJ|Constitucional[s]*)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Tribunals";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Gurtel|Imelsa|Assud|comissions|malversaci|pagaments)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Corrupció";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(28M|campanya\selectoral|eleccions|candidat[uraes]*|precampanya|programa\selectoral|votacio|electoral)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Eleccions28M";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(lider|PP|PSOE|CS|Podemos)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Partits";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(economia|empresa|cistella\sde\sla\compra|IPC|preus)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Economia";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(dependencia)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Dependència";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(pensions)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Pensions";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(extrema|dreta|colp|feixis[tame]+)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Feixisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(gos[so]|animal[ista]*|PACMA)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Ecologia";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(Generalitat|[Cc]onsell[eras]*|Corts|[Pp]arlamen[tarie]+)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/( ?!morada|formacio )/", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#Consell";
|
||||||
|
if(preg_match("/(Catalunya|Ponsati|Puigdemont|Borras)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Catalunya";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(8M)/", $rsst_ara))&&
|
||||||
|
(preg_match("/(?!28M)/", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#Política #Feminisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(corredor\sverd|sostenible|medi\snatural|Transicio\sEcologica|emergencia\sclimatica)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#MediAmbient";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(asteroide|planeta)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Astronomia";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(moros\si\scristians|ninot|lofrena|La\sMagdalena|Lechuguina|festes|festes\sfundacionals|romeria|mascleta[es]*|focs\artificials|carnestoltes|gaiat[esra]+|falle[ares]+|fogueres\sdAlacant|bellesa\sdel\sfoc|artist[aes]+\sfaller[s]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Festes";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Valle\sde\slos\Caidos|fosses\scomunes|victimes\sdel\sfranquisme|memoria\sdemocratics|Guerra\sCivil|franquisme)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#MemòriaHistòrica";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(mor[ts]*|precipitar|defuncio|accident)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
// elseif(preg_match("/(Casa\sBlanca|cimera|Marroc|[Pp]alestin|[Uu]crain[esa]*|Brasil|Xina|Ira[nianes]+|Argent[inaes]+|EUA|Estats\sUnits|[Ii]srael[ia]|Afghanistan|Afric[ans]+|Rus[eiaso]+|Peru[anes]*]|Washington)/", $rsst_ara)){
|
||||||
|
elseif( (preg_match("/(mon|EUA|Casa\sBlanca|cimera|Marroc|Israel|[Pp]alestin|Ucraïn[esa]+|Brasil|Xina|Iran[ianes]*|Argent[inaes]+|EUA|Estats\sUnits|Israel[ia]*|Afghanistan|Afric[ans]+|Rus[eiaso]+|Peru[anes]*]|Washington|Siria|Israel|Palestin[sae]+|Brasil|America|Europa|Asia|Oceania|Pakistan|Austria)/i", $rsst_ara))&&
|
||||||
|
// elseif( (preg_match("/(mon)/", $rsst_ara))&&
|
||||||
|
(preg_match("/( ?!Montan[tejos]+|Mona\sde\sPasqua|Mona)/", $rsst_ara)) ) {
|
||||||
|
|
||||||
|
$etiqueta = "#Món";
|
||||||
|
if(preg_match("/(covid|pandemia|OMS)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Món #Salut";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Pentagon|dron|caça|missil|atac|guerra|batalla|atac|tropes|alto\sel\foc|treva|Zelenski|Putin|Ucraïn[esa]+)i/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Món #Guerra";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Israel|Palestina|Hezbollah|Siria|mesquita|israelia[nes]*|palesti[nes]*|Proxim\sOrient)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#OrientPròxim";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(abatut[s]*|atrapat|accident|mort|violent|victim[aes]+|feri[tdes]+)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Món #Successos";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Representants|[Pp]resident|ministre|IRA|[Pp]arlament)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Món #Política";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Botanic|estatutaris)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(alerta\sclimatica|corredor\sverd|sostenible|medi\snatural|Transicio\sEcologica|emergencia\sclimatica)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Món #MediAmbient";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(mor[ts]*|precipitar|defuncio|accident)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(google|tik\stok|instagram|facebook|twitter|whatsapp|linkedin|app[s]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Xarxes";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Fiscalia|condem[adent]+|Tribunal|sentenci[aes]+|cassacio|CGPJ|Constitucional[s]*|jutg[esa])/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Tribunals";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(economia)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Economia";
|
||||||
|
if(preg_match("/(TSJ[CV]*|Tribunal[s]*)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Economia #Tribunals";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(hotel|turis[metas]+|estranger)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!vehicle|automobil)/i" ,$rsst_ara)) ){
|
||||||
|
$etiqueta = "#Economia #Turisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(ERTO|ERO|empresari|ocupacio|recessio|treballador|acomiadament|sindicat)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Economia #Treball";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(antimonopoli|barril|Brent|petroli)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Economia #Energia";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(govern|ministre|Brusselles)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Economia #Politica";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(tik\stok|instagram|facebook|twitter|whatsapp|linkedin|app[s]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Xarxes";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(pensions)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Política #Pensions";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(mor[t]*|precipitar|defuncio|accident)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos #Laboral";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(leucemia|fibrosi|encefalitis|cancer\sde|Parkinson|pediatr[aes]+|vacuna[cio]*|respiratori|grip|estreptococ|bronquiolitis|pandemia|malaltia|covid|neumonia|hospital[itz]*|sanita[tri]+|salut|infecci[ons]+)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Salut";
|
||||||
|
if(preg_match("/(pandemia|covid|endemia)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Sanitat #Salut";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(abus|naufragi|rescat[entads]*|estaf[aen]+|danys\spersonals|violen[ciatment]|apunyala[atd]|exparella|atracador[s]\sde\sbanc|violencia\sde\sgenere|allau|atropell[adt]+|segrest[ador]|mor[ta]+|autopsi[aes]|cadaver[s]|mata|assassi[nsat]|detingu[tsdea]|polici[alse]|robatori[s]|accident|sinistre|atracament[sdora]|feri[tsdesa]+|homicidi|preso[nera]|violad[arcio]|incendi)/", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!esports)/", $rsst_ara)) ) {
|
||||||
|
$etiqueta = "#Successos";
|
||||||
|
if(preg_match("/(abus\ssexual|exparella|masclis[meta]|violencia\sde\sgenere|don[aes]+\sassassinad[aes]+|agressio|prostitu[ciobulta])/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos #Masclisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(ministr[eas]|presiden[tcial]|antidemocratic)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos #Política";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(gos[so]|animal[s])/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Successos #Animalisme";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(futbo[listae]+|pilot[aes]+|basquet|basket|Mundial|esport[istesa]*|entrenador[esa]*|tenis[taes]*|embarcacio|Ocean\sRace)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Esports";
|
||||||
|
if(preg_match("/(bas[kqu]et|basquet|basket)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Esports #Bàsquet";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(futbol)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Esports #Futbol";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(ocean|veler|embarcacio)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Esports #Nàutica";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(F1|Formula\s1|Formula1)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#F1";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(rallie|Dakar)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Automobilisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(tennis|tenis)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Esports #Tennis";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(pilota|raspall|llargues)/", $rsst_ara)){
|
||||||
|
$etiqueta = "#Esports #Pilota";
|
||||||
|
if(preg_match("/(retransmissions|partit\sentre)/", $rsst_ara)) {
|
||||||
|
$etiqueta = "#Esports #PilotaÀPunt";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(mor[t]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Esports #Necrològica";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(fall[aers]+)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Esports #Festes";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(oratge|llamp|hivern|primaver[als]+|estiu|tardor|nuvo[ls]+|calo[rsad]+|plu[jages]+|boir[aes]+|tempest[aes]+|neva[rtdaes]*|tronad[aes]+|pedregad[aes]+|grani[sda]+|ponent[ada]*|mestral)/i", $rsst_ara))&&
|
||||||
|
(preg_match("/(?!manifestacio|Amazon|computa[ciodr]+)/", $rsst_ara)) ){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Oratge";
|
||||||
|
}
|
||||||
|
/** elseif(preg_match("/(Any|Cap\sd\sAny|Nadal|Betlem|loteria|cavalcada\sde\sReis)/", $rsst_ara)){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Nadal2022";
|
||||||
|
return $etiqueta;
|
||||||
|
} **/
|
||||||
|
elseif(preg_match("/(migrant|immigrant|xenofob|magreb[ina]+)/i", $rsst_ara)){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Xenofòbia";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(8M|[Ll]lei\sde\s[Ii]gualtat|LGTBI|8\sde\s[Mm]arç)/", $rsst_ara)){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Feminisme";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(masclis[aemt]+|prosti[abciolut]+|maltractador)/i", $rsst_ara)){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Masclisme";
|
||||||
|
}
|
||||||
|
elseif( (preg_match("/(Medi\sAmbient|conservacionis[meta]|vegetacio|ecologi[castes]+|desseca[rntseda]+|pardal|aus|porc[sater]*|pingui|pei[xosca]*|Albufera|plat[jages]+|clima[ticolg]+|escalfament)/i", $rsst_ara)) &&
|
||||||
|
(preg_match("/(?!Google)/", $rsst_ara)) ){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Ecologia";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(google|tik\stok|instagram|facebook|twitter|whatsapp|linkedin|app[s]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Xarxes";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Especial\sMagdalena|Especial\sFogueres|festes|festes\sfundacionals|romeria|mascletaes|focs\artificials|carnestoltes|gaiat[esra]+|falles|faller[a]*|fogueres\sdAlacant|bellesa\sdel\sfoc)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Festes";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(fosses\scomunes|victimes\sdel\sfranquisme|memoria\sdemocratics|Guerra\sCivil|franquisme)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#MemòriaHistòrica";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Alacant[inaes]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Alacant";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Castello[necs]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Castelló";
|
||||||
|
}
|
||||||
|
elseif(preg_match("/(Valencia[nse]*)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#València";
|
||||||
|
}
|
||||||
|
/**
|
||||||
|
elseif(preg_match("/(program[aescio]+)/i", $rsst_ara)){
|
||||||
|
//one of these string found
|
||||||
|
$etiqueta = "#Programes";
|
||||||
|
if(preg_match("/(cuin[aesr]+|recept[aes]+)/i", $rsst_ara)){
|
||||||
|
$etiqueta = "#Programes #Receptes";
|
||||||
|
return $etiqueta;
|
||||||
|
} elseif ( preg_match("/(parada|proxima|radio)/i", $rsst_ara) ) {
|
||||||
|
$etiqueta = "#Programes #Ràdio";
|
||||||
|
return $etiqueta;
|
||||||
|
} else {
|
||||||
|
return $etiqueta;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
**/
|
||||||
|
|
||||||
|
else {
|
||||||
|
$etiqueta = "#Actualitat";
|
||||||
|
}
|
||||||
|
return $etiqueta;
|
||||||
|
//final cadena
|
||||||
|
}
|
||||||
|
//final funció
|
||||||
|
}
|
||||||
|
?>
|
Loading…
Referencia en una nova incidència