1. Distribución de datos grandes
- Métodos de minería de datos (entrenamiento de sistemas individuales + predicción distribuida: algoritmos tradicionales de aprendizaje automático + predicción distribuida de Mapreduce)
- Apache Spark MLlib
2. Recomendaciones y publicidad:
- Lenguaje natural
- Agrupación de texto, categorización de texto (etiquetado), sinónimos
- Restauración del perfil de usuario, sistema de etiquetado
- Algoritmos recomendados
- Asegurar la precisión de "levantar" entre y dentro de las categorías
- Cómo crear ciclos cerrados para algoritmos de recomendación
1. Regresión lógica, RankingSVM,
2. Reconocimiento de funciones (aprendizaje profundo y reconocimiento automático de características para gráficos)
3. Lenguaje natural
- Segmentación de palabras chinas
- Modelo de tema (agrupamiento de texto)
- Clasificación del texto
- Extraer palabras clave
- Análisis semántico, analizador semántico, word2vec (vector a palabra)
- Arquitectura de memoria a largo plazo RNN (TSTM)