Sare-sozialak atzematea Webguneetan


Proiektu hau sortu zen Enpresen Informazioaren Gizarteari buruzko Inkestaren (IGIE) pisua deskargatzeko beharraren ondorioz. Zehazki, galdetegiko galderetako batean zentratzen da, eta webeko sare sozialetarako sarbidea aztertzen du.

Scraping teknikak erabiliz, galdera hori modu automatizatuan identifikatzea lortu da. Lortutako emaitzek erakusten dute teknika horiek eraginkorrak direla informazio mota hori detektatzeko eta aztertzeko.

Programazioaren garapen osoa Python-en egin da.


Enpresa bakoitzerako, dagokion URLra sartzen da, eta, scraping tekniken bidez, orri nagusitik nahiz esteka erabilgarrietatik nabigatzen da. Prozesu horretan, lotutako sare sozialak identifikatu eta ateratzen dira.


Ebaluazioa egiteko, scrapingak lortutako emaitzak IGIE inkestan jasotakoarekin alderatu dira, sare sozialek enpresen webguneetan duten presentziaren aldagaiari dagokionez. Proiektuaren ebaluazioa egin da, ondoz ondoko bi urteko inkestetan (2022 eta 2023) erantzundakoarekin.


Zehaztasuna (Accuracy):

Iragarpen guztien gaineko iragarpen zuzenen (egiazko positiboak eta egiazko negatiboak) proportzioa neurtzen du.

Zehaztasuna (Accuracy) = TP + TN / (TP + TN + FP + FN)

Zehaztasuna % 83koa da 2022an.

Zehaztasuna % 85 da 2023an.


Sentikortasuna (Sensitivity):

Ongi identifikatutako benetako positiboak.

Sentikortasuna (Sensitivity) = TP / (TP + FN)

Sentikortasuna % 78koa da 2022an.

Sentikortasuna % 81ekoa da 2023an.


Espezifikotasuna (Specificity):

Ongi identifikatutako benetako negatiboak.

Espezifikotasuna (Specificity) = TN / (TN + FP)

Espezifikotasuna % 95ekoa da 2022an.

Espezifikotasuna % 96koa da 2023an.


Balio Iragarle Positiboa (BIP):

Ereduak positiboak eta benetan positiboak direla aurreikusten dutenen proportzioa.

Balio Iragarle Positiboa (BIP) = TP / (TP + FP)

BIP % 97koa da 2022an.

BIP % 98koa da 2023an.

Sare sozialak dituela iragartzen duenean, iragarpena zuzena izateko % 98ko probabilitatea dago.


Balio Iragarle Negatiboa (BIN):

Ereduak negatiboak eta benetan negatiboak direla iragartzen dutenen proportzioa.

Balio Iragarle Negatiboa (BIN) = TN / (TN + FN)

BIN % 64koa da 2022an.

BIN % 66koa da 2023an.






  • Egiazko positiboak identifikatzeko gaitasuna: ereduak % 80ko sentsibilitatea erakusten du, eta horrek kasu positiboak detektatzeko gaitasun handia adierazten du.
  • Zehaztasun orokor handia.
  • Bikaina da egiazko negatiboak identifikatzen: % 95eko espezifikotasuna oso handia da.
  • Sare sozialen baieztapen zehatza: % 98ko BIP balioak esan nahi du ereduak iragartzen duenean web orri batek sare sozialen integrazioak dituela, % 98ko probabilitatea dagoela iragarpen hori zuzena izateko.
  • Errendimendu sendoa: Modeloak zehaztasun handia, espezifikotasun bikaina eta iragarpen-balio positibo aparta ditu.



Zure feedback-a.  Lagun iezaguzu gure weba zure beharretara egokitzen

Nola baloratzen duzu orri honen Informazioa?
Oso baliagarria
Baliagarria
Ez oso baliagarria
Ez da inondik ere baliagarria
Baduzu iradokizunik?
Bai, badut
Bidali