2024-01-27 详细复现Transformer 兴趣 详细复现 Transformer 模型分解 为了实现一个基本的Transformer模型,我们需要构建以下几个主要组件: Multi-Head Attention:多头注意力机制,允许模型同时关注输入的不同部分。 Positiona
2024-01-27 详细复现BERT 兴趣 详细复现 BERT 实现自注意力机制 BertSelfAttention 是 BERT 中的自注意力机制实现,它可以让模型在处理每个单词时考虑到句子中的其他单词,这有助于模型理解单词上下文中的依赖关系。 123456789101112131
2024-01-27 SQL常见用法 兴趣 工具 SQL 常见用法 数据定义语言 (DDL) CREATE 创建数据库对象,如数据库、表、索引、视图等。 123456CREATE TABLE employees ( employee_id INT PRIMARY KEY,
2024-01-27 Shell命令汇总 兴趣 工具 Shell 命令汇总 1.目录操作 ls:列出目录内容。使用 -l 选项以长列表格式显示详细信息,使用 -a 显示隐藏文件。 1ls -la cd:更改目录。 1cd /path/to/directory pwd:显
2024-01-16 Docker常见用法 兴趣 工具 Docker 常见用法 安装 Docker 在不同的操作系统上安装 Docker 的方法会有所不同。在大多数 Linux 发行版中,Docker 可以通过包管理器安装。 123456789101112# Ubuntu/Debian sud
2024-01-16 Git常见命令 兴趣 工具 Git 常用命令 核心概念 工作区(Working Directory):包含当前代码的本地目录。 暂存区(Staging Area 或 Index):一个保存下次将提交的文件列表的区域。 仓库(Repository):Git
2024-01-16 PyTorch常见用法 兴趣 工具 PyTorch常见用法 1. 导入 PyTorch 库 123456import torch import torch.nn as nn import torch.optim as optim import torch.nn.func