我要投稿

仅需八步，打造私人专属智能股票预测模型

发布日期：2024-10-29 08:07:21 浏览次数： 4198

作者：老余捞鱼

微信搜一搜，关注“老余捞鱼”

写在前面的话：创建属于自己的股票价格预测模型一定会让我们感到兴奋和满足！本文将提供一份详细的搭建指南，带领大家使用 Python 语言和一些库来构建专属于你个人的股票价格预测模型。您如果没有太多编程经验也不用担心，跟着我一步步来，你也能成功。

一、为什么要创建自定义股票预测模型？

创建自定义股票预测模型的原因是多样的，这体现了投资者对市场的深入理解以及对个性化策略的追求。我认为主要原因体现在以下三个方面：

洞察：深入了解不同因素如何影响股票价格。

首先，市场是复杂多变的，传统的预测方法可能无法全面捕捉市场动态。通过构建自定义模型，投资者可以根据自己对市场的独特见解，将多种因素纳入考量范围，如宏观经济指标、公司财务状况、市场情绪等，从而更准确地预测股票价格的走势。

定制：根据您的具体需求和偏好定制模型。

其次，自定义模型允许投资者根据自己的风险偏好和投资目标进行个性化调整。不同的投资者有不同的投资理念和策略，通过自定义模型，他们可以将这些理念融入预测过程中，制定出更符合自己需求的投资策略。

创新：尝试各种技巧，发现最适合自己的方法。

此外，自定义模型还具有一定的灵活性和可扩展性。随着市场环境和投资者需求的变化，投资者可以不断对模型进行优化和改进，以适应新的市场情况。这种灵活性使得自定义模型在应对市场变化时更加得心应手。

二、搭建自定义股票预测模型

第①步需要了解的工具和库

在深入了解代码之前，让我们先熟悉一下我们要用到的工具和库：

Python：我们将使用的编程语言。
Pandas：用于数据处理。
NumPy：用于数值运算。
Scikit-learn：用于构建和评估机器学习模型。
XGBoost 和 LightGBM：先进的增强技术，可提高准确性。
Yahoo Finance：雅虎财经，用于获取股票数据。

第②步加载和准备数据

首先，您需要股票数据。下面介绍如何获取和准备数据：


import yfinance as yfimport pandas as pd

def load_data(ticker):stock = yf.Ticker(ticker)df = stock.history(period="1y")df['Date'] = df.indexreturn df

第③步添加技术指标

要进行预测，就需要创建反映市场状况的特征。以下是一些可以使用的技术指标：


def bollinger_bands(close, window=20, num_std=2):rolling_mean = close.rolling(window=window).mean()rolling_std = close.rolling(window=window).std()upper_bb = rolling_mean + (rolling_std * num_std)lower_bb = rolling_mean - (rolling_std * num_std)return upper_bb, lower_bb

def compute_rsi(close, window=14):delta = close.diff()gain = (delta.where(delta > 0, 0)).rolling(window=window).mean()loss = (-delta.where(delta < 0, 0)).rolling(window=window).mean()rs = gain / lossreturn 100 - (100 / (1 + rs))

第④步选择并训练模型

我们将使用各种模型和集合技术来获得最佳结果：


from sklearn.model_selection import train_test_splitfrom sklearn.pipeline import Pipelinefrom sklearn.preprocessing import StandardScalerfrom sklearn.ensemble import VotingRegressorfrom sklearn.linear_model import LinearRegressionfrom sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressorfrom sklearn.svm import SVRimport xgboost as xgbimport lightgbm as lgbmodels = {'Decision Tree': DecisionTreeRegressor(random_state=42),'Linear Regression': LinearRegression(),'Random Forest': RandomForestRegressor(random_state=42),'Gradient Boosting': GradientBoostingRegressor(random_state=42),'Support Vector Machine': SVR(),'XGBoost': xgb.XGBRegressor(random_state=42),'LightGBM': lgb.LGBMRegressor(random_state=42)}def train_and_evaluate(X, y, selected_models):X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)scaler = StandardScaler()if len(selected_models) > 1:voting_regressor = VotingRegressor(estimators=[(name, models[name]) for name in selected_models])model = Pipeline(steps=[('scaler', scaler),('regressor', voting_regressor)])else:model = Pipeline(steps=[('scaler', scaler),('regressor', models[selected_models[0]])])model.fit(X_train, y_train)y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)mse = mean_squared_error(y_test, y_pred)rmse = np.sqrt(mse)r2 = r2_score(y_test, y_pred)mape = mean_absolute_percentage_error(y_test, y_pred)
return mae, mse, rmse, r2, mape, y_test, y_pred, model

第⑤步多模型结合

这种方法的强大功能之一是能够将多个模型组合成一个更强大的模型。这通常比单独使用任何一个模型都能带来更好的性能。下面介绍如何使用投票回归器组合模型：

第⑥步保存您的模型

训练好模型后，将其保存起来，这样就可以重复使用，无需重新训练：


import pandas as pdimport numpy as npimport yfinance as yf
import joblibLoad the trained modelmodel = joblib.load('trained_model.pkl')…def on_button_clicked(b):global trained_modelwith output:clear_output()selected_models = [checkbox.description for checkbox in model_checkboxes if checkbox.value]if selected_models:print(f"Running models: {', '.join(selected_models)}")mae, mse, rmse, r2, mape, y_test, y_pred, trained_model = train_and_evaluate(X, y, selected_models)print("\nModel Evaluation Metrics:")print(f"Mean Absolute Error: ${mae:.2f}")print(f"Mean Squared Error: ${mse:.2f}")print(f"Root Mean Squared Error: ${rmse:.2f}")print(f"R^2 Score: {r2:.4f}")print(f"Mean Absolute Percentage Error: {mape:.2f}%")
print("\nSample of predictions vs true values:")results_df = pd.DataFrame({'True Price': y_test, 'Predicted Price': y_pred})display(results_df.head())
# Save the trained modelsave_model(trained_model, 'trained_model.pkl')
else:print("Please select at least one model.")

第⑦步模型评估指标

评估模型的性能对于了解其运行状况至关重要。以下是一些常见的指标：

平均绝对误差 (MAE)：预测值与实际值之间的平均绝对误差。
平均平方误差 (MSE)：预测值与实际值之间的平均平方误差。
均方根误差 (RMSE)：均方根误差（MSE）的平方根，表示误差大小。
平均绝对百分比误差 (MAPE)：预测值与实际值之间的平均绝对百分比误差。


mae = mean_absolute_error(y_test, y_pred)mse = mean_squared_error(y_test, y_pred)rmse = np.sqrt(mse)r2 = r2_score(y_test, y_pred)mape = mean_absolute_percentage_error(y_test, y_pred)
return mae, mse, rmse, r2, mape, y_test, y_pred, model

第⑧步加载模型和股票价格预测

保存并加载模型后，您就可以用它来预测股票价格了。以下是如何使用训练后的模型预测未来股票价格的方法：


# Prepare a list to store predictionspredictions = []
# Check if the recent_data DataFrame has the correct number of columnsif recent_data.shape[1] != len(expected_features):raise ValueError(f"Expected {len(expected_features)} features but got {recent_data.shape[1]}")

# Predict future pricesfor _ in range(future_days):# Predict the next day's priceprediction = model.predict(recent_data)    predictions.append(prediction[0])        
# Create a new row for future predictionnew_row = recent_data.copy()new_row.loc[0, 'Open'] = prediction[0]# Update the 'Open' feature for the new row
# Append new_row to recent_datarecent_data = pd.concat([recent_data[1:], new_row], ignore_index=True)

return predictions

想尝试创建自己的股价预测模型了吗？我建立了一个 Google Colab ，你可以在线试用代码，并可根据自己的需要进行定制，还能进一步在自己的模型中用任何您感兴趣的股票代码替换现有的股票。

Google Colab 笔记本地址：https://colab.research.google.com/drive/1-LnvPHVLzM-sIDSUvyTxQFGQe8cN_PRN?usp=sharing#scrollTo=RQ5XJ9-pIxvx

三、观点回顾

建立自己的股价预测模型是一种非常有益的体验。您可以自定义模型的方方面面，从特征选择到使用的算法。通过灵活组合不同的模型和技术指标，您可以创建一个完全适合自己交易风格的工具。

自定义模型的优势：自建股票价格预测模型可以让用户根据个人需求和偏好进行定制，更好地理解不同因素如何影响股票价格，并有机会尝试创新的技术。
必要的工具和库：为了构建模型，需要掌握Python编程语言，并且熟练使用数据处理和机器学习相关的库，如Pandas、NumPy、Scikit-learn、XGBoost和LightGBM。
数据准备和特征工程的重要性：加载和准备数据是建模前的关键步骤，特征工程如添加技术指标可以帮助模型更好地反映市场条件。
多模型集成：通过结合多个模型，如使用投票回归器，可以提高模型的预测能力和鲁棒性。
模型评估指标：使用MAE、MSE、RMSE、R²分数和MAPE等评估指标来衡量模型的性能，帮助用户了解模型的优势和不足。
实践和定制：提供了实际的代码示例和Google Colab笔记本，鼓励读者动手实践，并根据自己的交易风格调整模型。