Implementation of the SnowballC stemmer. Note that punctuation and capital letters are removed when processing.
pr_stem_sentences(df, col, language = "french")
df | the data.frame containing the text |
---|---|
col | the column with the text |
language | the language of the text. Defaut is french. See SnowballC::getStemLanguages() function for a list of supported languages. |
a tibble
#> # A tibble: 10 x 4 #> text book volume year #> * <chr> <chr> <chr> <dbl> #> 1 des le matin la têt encor tourn contr le mur et … La Prison… Tome Uni… 1923 #> 2 quand je pens mainten que mon ami était venu à n… La Prison… Tome Uni… 1923 #> 3 quand albertin sav par françois que dan la nuit … La Prison… Tome Uni… 1923 #> 4 le douleur sont de foll et qui le écout est enco… La Prison… Tome Uni… 1923 #> 5 je l'aim trop pour ne pas joyeux sourir de son m… La Prison… Tome Uni… 1923 #> 6 une chanson d'adieu sort de sourc troubl La Prison… Tome Uni… 1923 #> 7 une nu pass elle éclips le soleil je voi s'étein… La Prison… Tome Uni… 1923 #> 8 le cloison qui sépar nos deux cabinet de toilet … La Prison… Tome Uni… 1923 #> 9 d'autr fois je rest couch rêv auss longtemp que … La Prison… Tome Uni… 1923 #> 10 je son françois j'ouvr le figaro j'y cherch et c… La Prison… Tome Uni… 1923