PCMAN的技术博客

截止2025年12月reInvent最新一代CPU处理器型号详情

本文与2025年11月更新。

2025-11-22

使用Bedrock批量推理Batch Inference处理Embedding任务

一、批量推理场景

通常构建Agent应用、和模型对话的Bedrock InvokeModel API是实时同步调用，如果遇到体积较大任务，例如图像生成或者视频生成，还可能使用异步调用InvokeModelAsync。这两种调用本质上都是预期很快返回结果的，只是Async不是一直等待那里。如果有这样一种业务场景，有海量的数据需要被处理，可能是一般的文本推理、可能是图片理解、还可能是Embedding，业务场景会一个批次提交大量待处理的文件，并且没有时间期限的要求，等待几个小时才处理好是可以接受的。此时这种场景，就适合Bedrock Batch Inference。

2025-11-21

云上私有化模型部署：使用llama.cpp和vLLM在CPU和GPU上运行开源模型

一、背景

进入2025年，大语言模型LLM的发展已经经过了几轮迭代，大量国产开源模型涌现出来，并在文本生成、多模态图像理解、Embedding等多个场景中证明了自己的优秀能力。其中，Qwen-VL系列模型被广泛使用。尤其是2b/4b/7b/8b这些参数量较小的模型，对硬件配置要求低，便于私有化部署。同时，小参数量的模型还便于用户自己发起Fine-tune微调，只需要花费较低的训练成本就能满足特定业务要求。本文分别演示了在CPU上使用llama.cpp运行推理，以及使用Nvidia L4 GPU的EC2 G6系列机型和vLLM运行开源模型。

2025-11-18

使用Nova MME多模态Embedding模型进行图片搜索

一、背景

Amazon Nova Multimodal Embeddings模型（以下简称Nova MME）是亚马逊最新发布的新一代Embedding模型，支持输入高达8192 Tokens。核心能力包括支持多模态输入（视频、图片、文本），可实现以文搜图、以图搜图，支持最高3072维度的向量，也支持1024等较低维度以降低成本。

Nova MME支持的图片格式有JPEG, PNG, GIF, WebP，可通过Bedrock服务的API发起调用，并可根据文件尺寸选择同步调用或者异步调用。针对生成的向量，可使用多种向量数据库存储，包括Amazon OpenSearch Service（普通集群或Serverless集群）、PostgreSQL通过pgvector扩展支持向量存储和检索，此外还可以使用S3 Vector Bucket实现低成本的存储和检索。

2025-11-14

GenAI/Bedrock/Claude/Nova/MCP/Agentic汇总

更新于2025年11月。

本帖为GenAI/Bedrock/Claude/Nova/MCP/智能体/Strands Agents相关博客汇总，点击如下帖子标题阅读。

2025-10-12

Bedrock Agentcore 入手 (一) 之Code Interpreter代码沙箱

一、背景

Bedrock AgentCore是AWS推出的服务于大模型和智能体应用的一组工具的集合。在构建智能体过程中，遇到了调用外部资源需要沙盒、托管MCP Server、托管智能体、长时间对话记录保存等多种挑战，通过各种技术栈手工搭建固然可以实现，但开发周期、实现成本、维护难度较高。由此可使用Bedrock AgentCore的一系列组建来解决这些挑战。AgentCore主要包括的套件如下。

2025-10-09

Wordpress on AWS 最佳实践 & 迁移到S3静态化方案

一、背景

Wordpres是国外常见的、流行的建站应用程序，基于PHP软件开发以MySQL数据库为核心，小巧快速。Wordpress拥有超过20年的软件生态体系，大量第三方免费插件、收费插件都可通过社区获得。Wordpress可快速满足内容发布（CMS）、在线商城等多种类型的动态网站构建和管理。搭建Wordpress是相对简单、快速的，根据不同的业务需求、访问量，在做架构设计时候可能有许多不同角度的考量。这里分享如下。

2025-09-25

在Bedrock上使用OpenAI风格的单一API Key

2025年Bedrock新推出了单一API Key功能，本文介绍如何使用。

2025-09-24

Strands Agents 下篇 - Multi-Agent & A2A

在上一篇文章中，我们介绍了如何使用Strands Agents SDK构建一个简单的A2A Server和Client进行通信，本篇讲构建Swarm、Graph和Workflow三种形式的A2A应用。

2025-09-23

Strands Agents 中篇 - 构建 Agent & Agent as Tool

上一篇介绍了使用Strands Agents构建MCP之后，本篇进入A2A话题，使用Strands Agents构建一个A2A Server接受A2A Client调用，并演示Agent as Tool的设计模式。

2025-09-21

Strands Agents 上篇 - Tool use & 构建MCP Server

本篇是Strands Agents系列第一篇，讲解基础的Tool use使用以及用Strands Agents构建一个MCP Server。

2025-09-21

对MySQL数据库特定字段进行全文检索

一、背景

现有数据库某字段保存有大量文本，现在需要对多条数据进行全文检索，以确定哪些条数据包含关键字。此时可使用MySQL全文检索。在搜索之前，需要为响应的字段增加索引，这一步会产生较大的系统资源消耗，请谨慎操作。

使用方法如下文。

2025-09-04

CloudFront为S3静态网站加速时候的CORS配置

一、背景

CORS的全称是Cross-Origin Resource Sharing，是浏览器跨站访问的技术规范。在使用S3静态托管时候，如果网页中的调用使用了CORS，那么需要为S3和CloudFront增加对应策略，才可以正常加载内容。

2025-08-25

使用CloudFront+S3提供静态网站Hosting

本文介绍了静态网站托管场景中，如何使用CloudFront将一个处于非公开状态的S3存储桶对外发布为静态网站。

一、使用S3直接提供静态网站的挑战

S3提供静态网站Hosting的方式是官方使用S3提供网站托管的推荐主要方式，此时直接对外暴露S3存储桶，也就是必须将S3存储桶设置为Public可见。如果本AWS账户内仅有一个S3存储桶并配置为公开，可能问题不大。但是对于大部分企业用户，尤其是混合多种业务数据管理的场景、一个账号内有许多存储桶，将存储桶设置为Public会遇到安全挑战问题。

2025-08-19

使用Amazon Bedrock Inference Profile结合Tag实现模型调用费用分拆

一、背景

Amazon Bedrock Inference Profile功能是2024年底推出的一项功能，在诞生之初，主要用于实现跨Region推理，而通过给Profile增加Tag的方式，即可实现费用追踪。

2025-07-09

为Amazon Workmail配置自动发现Auto Discover

一、背景

在配置邮件客户端的过程中，连接邮箱时除了输入域名、用户名、密码之外，通常需要手工填写收发邮件的服务器地址。此时如果打开了Auto Discover也就是自动发现功能，就能无需手工输入，邮件客户端将自动识别服务器地址，大大简化了配置过程。目前电脑上在用的邮件客户端、手机上的邮件客户端都具备自动发现功能。

当使用Amazon Workmail提供邮箱服务的时候，默认是不开启Auto Discover功能的，需要手工配置。本文介绍如何配置。

2025-06-20

如何为Amazon Workmail启用MFA双因素认证

本文介绍如何为Amazon Workmail启用IAM Identity Center并开启MFA多因素认证。

一、背景

Amazon Workmail邮件系统自身有内部的目录服务，可用于用户数量较少的快速部署和使用。在此时登录界面上是不支持配置MFA的。即便点击Workmail的设置图标，在其中也无法找到开启MFA的选项。这是由于Amazon Workmail内置的目录认证服务是不支持MFA的。

为了开启MFA，需要将Amazon Workmail配置为使用IAM Identity Center服务（以前叫做AWS Single Sign-On即SSO，以下简称IdC服务），并在IdC服务中管理用户和分组。此时在IdC服务中，可以设置用户第一次登录时候必须强制绑定MFA，即可满足安全合规要求。IdC服务支持主流的软件MFA，例如Microsoft Authenticator，Google Authenticator等手机APP，也支持硬件形式的USB Token。

下面开始配置。

2025-06-09

SageMaker Studio SSO 效果演示

SageMaker Studio 对多用户并行开发的权限管理方式之一，是可以与企业现有单点认证系统对接，然后每个企业目录的用户就可以直接对应到一个SageMaker Studio内的Notebook。在这种对接方式下，SageMaker Studio首先与IAM Identity Center（IdC）集成，然后使用 External Source 连接外部的Identity Source，即可实现第三方SSO对接。

2025-06-06

关于S3系统是否满足“被动式”系统以及无法运行可执行文件的合规性问题描述

在一些信息系统审计中，可能会被要求提交“S3存储是一个被动式系统”、“S3不会主动向外发起网络连接”、“S3不会执行存储的可执行文件”等证明资料。建议通过S3合规性最佳实践进行系统的解答。

2025-05-14

MCP系列：启动你的第一个MCP Server并与之交互

本文展示了一个MCP Server和Client的运行交互过程，通过Step-by-step的打印日志，帮助理解MCP是如何工作的。本文引用的代码参考文中的Github链接。

2025-04-20