Top 10 słów kluczowych w Quantum SEO Analyzer v2 jest wybieranych na podstawie gęstości słów kluczowych obliczonej dla czystej treści tekstowej strony. Poniżej wyjaśniamy, jak przebiega ten proces i na jakiej podstawie tworzone są wyniki.
Proces wyboru top 10 słów kluczowych
Ekstrakcja czystego tekstu
Najpierw z kodu strony usuwane są elementy takie jak skrypty, style, ramki czy sekcje nawigacyjne, aby uzyskać wyłącznie treść tekstową, taką jak artykuły, nagłówki czy akapity. Tekst jest oczyszczany z nadmiarowych białych znaków i ograniczany do maksymalnie 30 000 znaków, co zapewnia przetwarzanie tylko istotnych danych.
Obliczanie gęstości słów kluczowych
Oczyszczony tekst jest przetwarzany w następujący sposób:
- Tokenizacja: Tekst rozbijany jest na pojedyncze słowa po usunięciu znaków specjalnych, takich jak interpunkcja.
- Liczenie słów: Zliczana jest liczba wystąpień każdego słowa w tekście.
- Filtrowanie: Pomijane są słowa krótsze niż 4 znaki, aby wykluczyć nieistotne wyrazy, takie jak „i” czy „w”.
Obliczanie gęstości: Dla każdego słowa obliczany jest procentowy udział w całkowitej liczbie słów według wzoru:
Gęstość=(Liczba wystąpień słowa / Całkowita liczba słów)×100Wynik jest zaokrąglany do dwóch miejsc po przecinku.
- Sortowanie: Słowa są sortowane malejąco według gęstości.
- Ograniczenie wyników: Wybieranych jest maksymalnie 20 słów z najwyższą gęstością, ale do wyświetlenia trafia tylko top 10.
Wybór top 10 słów kluczowych
Top 10 słów kluczowych to 10 słów z najwyższą gęstością, które są zapisywane w danych analizy strony. Te słowa są wykorzystywane nie tylko do wyświetlenia w tabeli, ale także do analizy nagłówków, gdzie sprawdzane jest, czy pokrywają się z frazami w nagłówkach.
Wyświetlanie w interfejsie
W interfejsie użytkownika top 10 słów kluczowych jest prezentowane w tabeli, pokazując każde słowo wraz z jego gęstością (w procentach). Tabela jest generowana dynamicznie na podstawie danych otrzymanych z serwera, wyświetlając tylko 10 najważniejszych słów.
Kluczowe cechy procesu
- Brak usuwania stop words: Standardowe słowa, takie jak „i”, „w” czy „na”, nie są automatycznie wykluczane podczas obliczania gęstości, więc mogą pojawić się w top 10, jeśli występują często. Jednak w analizie nagłówków niektóre z tych słów są pomijane.
- Minimalna długość słowa: Słowa krótsze niż 4 znaki są ignorowane, co eliminuje większość nieistotnych wyrazów.
- Sortowanie po gęstości: Priorytet mają słowa najczęściej występujące w treści.
- Limit 10 słów: Zawsze wyświetlane jest dokładnie 10 słów, nawet jeśli więcej ma wysoką gęstość.
Przykład
Załóżmy, że strona zawiera tekst:
„Quantum SEO Analyzer to narzędzie do analizy SEO. SEO jest kluczowe dla sukcesu strony. Analyzer pomaga w optymalizacji.”
„Quantum SEO Analyzer to narzędzie do analizy SEO. SEO jest kluczowe dla sukcesu strony. Analyzer pomaga w optymalizacji.”
Po przetworzeniu:
- Tekst jest oczyszczany i dzielony na słowa: „quantum”, „seo”, „analyzer”, „narzędzie”, „analizy”, „kluczowe”, „sukcesu”, „strony”, „pomaga”, „optymalizacji”.
- Zliczane są wystąpienia:
- „seo”: 2 razy
- „analyzer”: 2 razy
- „quantum”: 1 raz
- itd.
- Całkowita liczba słów: 10.
- Gęstość:
„seo”: ( 2 / 10 ) × 100 = 20%
„analyzer”: ( 2 / 10 ) × 100 = 20%
„quantum”: ( 1 / 10 ) × 100 = 10%
- itd.
- Top 10 słów kluczowych: „seo”, „analyzer”, „quantum”, „narzędzie”, „analizy”, „kluczowe”, „sukcesu”, „strony”, „pomaga”, „optymalizacji”.