1. Diese Seite verwendet Cookies. Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies. Weitere Informationen

PHP preg_replace

Dieses Thema im Forum "Web-Programmierung" wurde erstellt von ma.buso, 04.07.07.

  1. ma.buso

    ma.buso Châtaigne du Léman

    Dabei seit:
    16.04.05
    Beiträge:
    824
    Ich versuche gerade, aus Texten irrelevante Worte rauszuziehen.

    Dazu hab ich zwei Arrays gefunden mit deutschen und engl. "Stoppwörtern":
    Code:
    // [...]
          $stopwords["de"][] = "dazu";
          $stopwords["de"][] = "dem";
          $stopwords["de"][] = "den";
          $stopwords["de"][] = "denn";
    // [...]
    Weiters will ich dann die Wörter rausschmeißen:

    Code:
    $Search[] = "=(\s[A-Za-z]{1,2})\s=";
    $Search[] = "= " . implode(" | ", $stopwords["de"]) . " =i";
    $Search[] = "= " . implode(" | ", $stopwords["en"]) . " =i";
    $Search[] = "= +=";
    
    $Replace[] = " ";
    $Replace[] = " ";
    $Replace[] = " ";
    $Replace[] = " ";
    
    $String = " " . str_replace(" ", "  ", $String) . " ";
    $String = trim(preg_replace($Search, $Replace, $String));
    Komisch nur, dass er nicht alle rausschmeißt. Da handelt es sich auch nicht um bestimmte örter, die er komplett drin lässt, sondern er schmeißt z.B. ein Paar "dann" raus und ein Paar lässt er drin.
    Vielleicht kann mir jemand sagen, wo der Fehler liegt.
     
  2. mewX

    mewX Wohlschmecker aus Vierlanden

    Dabei seit:
    26.12.06
    Beiträge:
    241
    So vllt.?
    Code:
    $Search[] = "=[" . implode("|", $stopwords["de"]) . "]=i";
    $Search[] = "=[" . implode("|", $stopwords["en"]) . "]=i";
    
    Sonst setzt er vermutlich die RegExps nichts richtig zusammen..
     
  3. ma.buso

    ma.buso Châtaigne du Léman

    Dabei seit:
    16.04.05
    Beiträge:
    824
    so geht's gleich garnicht :) außerdem würde er so aus den wörtern, welche die stoppwörter enthalten diese rauslöschen, sodass man nur noch kauderwälsch übrig hätte.

    habe jetzt erstmal alle wörter mit weniger als 4 buchstaben gekickt und auf einmal geht's pima - das verstehe wer will .... ;)
     

Diese Seite empfehlen