AppsNews

Καμία βασική εκπαίδευση του Apple Intelligence σχετικά με το περιεχόμενο του YouTube

0

Γεμάτη ανησυχίες ήταν η Apple σχετικά με τη χρήση δεδομένων εκπαίδευσης τεχνητής νοημοσύνης και αυτό έγινε ακόμη πιο αντιληπτό μετά από έρευνα που έδειξε πως η εταιρεία από το Cupertino μαζί με άλλες μεγάλες εταιρείες τεχνολογίας, είχαν χρησιμοποιήσει υπότιτλους στο YouTube για να εκπαιδεύσουν τα μοντέλα τεχνητής νοημοσύνης τους.

Η έρευνα του Wired νωρίτερα ανέφερε ότι πάνω από 170.000 βίντεο από δημοφιλείς δημιουργούς περιεχομένου ήταν μέρος ενός συνόλου δεδομένων που χρησιμοποιείται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Η Apple χρησιμοποίησε συγκεκριμένα αυτό το σύνολο δεδομένων για την ανάπτυξη των μοντέλων OpenELM ανοιχτού κώδικα, τα οποία δημοσιοποιήθηκαν τον Απρίλιο.

Ωστόσο, η Apple έχει πλέον επιβεβαιώσει στο 9to5Mac ότι το OpenELM δεν τροφοδοτεί καμία από τις λειτουργίες AI ή μηχανικής εκμάθησης, συμπεριλαμβανομένου του συστήματος Apple Intelligence της εταιρείας. Η Apple διευκρίνισε ότι το OpenELM δημιουργήθηκε αποκλειστικά για ερευνητικούς σκοπούς, με στόχο την προώθηση της ανάπτυξης μοντέλων μεγάλων γλωσσών ανοιχτού κώδικα.

Κατά την κυκλοφορία του OpenELM στο Hugging Face Hub, μια κοινότητα για κοινή χρήση κώδικα AI, οι ερευνητές της Apple το περιέγραψαν ως ένα “μοντέλο ανοιχτής γλώσσας τελευταίας τεχνολογίας” που είχε σχεδιαστεί για να “ενδυναμώσει και να εμπλουτίσει την ανοιχτή ερευνητική κοινότητα”. Το μοντέλο είναι επίσης διαθέσιμο μέσω του ιστότοπου Machine Learning Research της Apple και η ίδια δήλωσε ότι δεν σκοπεύει να αναπτύξει νέες εκδόσεις του μοντέλου OpenELM.

Μια διευκρίνιση που έκανε η εταιρεία είναι πως από την στιγμή που το OpenELM δεν είναι ενσωματωμένο στο Apple Intelligence, το σύνολο δεδομένων “Υπότιτλοι YouTube” δεν χρησιμοποιείται για την τροφοδοσία οποιασδήποτε από τις εμπορικές λειτουργίες AI του. Η Apple επανέλαβε την προηγούμενη δήλωσή της ότι τα μοντέλα Apple Intelligence εκπαιδεύονται σε “δεδομένα με άδεια χρήσης, συμπεριλαμβανομένων των δεδομένων που επιλέγονται για τη βελτίωση συγκεκριμένων λειτουργιών, καθώς και στα δημόσια διαθέσιμα δεδομένα που συλλέγονται από το πρόγραμμα ανίχνευσης ιστού μας”.

Επιπλέον, το Wired ανέφερε λεπτομερώς πώς εταιρείες όπως η Apple, η Anthropic και η NVIDIA είχαν χρησιμοποιήσει το σύνολο δεδομένων “Υπότιτλοι YouTube” για εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Αυτό το σύνολο δεδομένων είναι μέρος μιας μεγαλύτερης συλλογής γνωστής ως “The Pile”, η οποία έχει συγκεντρωθεί από τον μη κερδοσκοπικό οργανισμό EleutherAI.

[via]

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Συνδεθείτε για να σχολιάσετε

Καλώς ήλθατε {{inv_username}}

comments

  1. says:
    {{ getCommDate(item.date) }}

{{inv_error}}

Σύνδεση

You may also like