Fix NoWebRing option, only deduplicate if we're using it

pull/9/head
idk 2022-03-24 20:41:28 -04:00
rodzic 52c0e9be85
commit c38e43fd95
Nie znaleziono w bazie danych klucza dla tego podpisu
ID klucza GPG: D75C03B39B5E14E1
1 zmienionych plików z 8 dodań i 9 usunięć

Wyświetl plik

@ -190,22 +190,21 @@ func Precrawl(config types.Config) {
items := make([]string, 0)
switch config.General.NoWebRing {
case true:
doc.Find("li").Each(func(i int, s *goquery.Selection) {
if domain, exists := s.Find("a").Attr("href"); exists {
items = append(items, domain)
}
})
default:
doc.Find("a").Each(func(i int, s *goquery.Selection) {
if domain, exists := s.Attr("href"); exists {
items = append(items, domain)
}
})
// remove duplicates
items = util.DeduplicateSlice(items)
default:
doc.Find("li").Each(func(i int, s *goquery.Selection) {
if domain, exists := s.Find("a").Attr("href"); exists {
items = append(items, domain)
}
})
}
// remove duplicates
items = util.DeduplicateSlice(items)
BANNED := getBannedDomains(config.Crawler.BannedDomains)
for _, item := range items {
link := getLink(item)