Amazon 解决下载文件乱码
大家在做多个站点的时候,可能会遇到下载下来的报告文件出现乱码。
法国站点和意大利站点均会出现这样的情况,那怎么解决呢?
这是由于编码的问题而导致,在我们读取数据插入到本地数据库的时候,不妨先将格式转成对应国家能正确识别的格式。
在文档中也有看到。

还要一个问题需要说明,由于操作系统设置默认语言的原因,在小国家站点,我们下载下来的报告可能会出现乱码的情况。这种情况很正常,在调用接口的时候,也没有办法去解决直接下载就出现正常编码。
现在的方法是将下载下来的乱码文件,通过流操作,重新编码,根据上图对应的编码来设置编码。
文章来自[https://www.cnblogs.com/yangda/p/3963220.html](https://www.cnblogs.com/yangda/p/3963220.html)
以下已验证可行
```
# 检测编码,未检测到用市场指定的编码转utf8;检测出来,用检测的编码转utf8;如果是utf8,则不作处理
// $encode = mb_detect_encoding($result, array("UTF-8",'iso-8859-1',"Shift_JIS","cp1252",'UTF-16'));
$encode = mb_detect_encoding($result);
if($encode == false){
$marketplaceId = $this->config['Marketplace_Id'];
if(in_array($marketplaceId, $this->market_EU) || in_array($marketplaceId, $this->market_US)){
$result = mb_convert_encoding($result, "UTF-8", ["iso-8859-1", "cp1252"]);
}else if(in_array($marketplaceId, $this->market_JP)){
$result = mb_convert_encoding($result, 'UTF-8', ["Shift_JIS"]);
}else if(in_array($marketplaceId, $this->market_CN)){
$result = mb_convert_encoding($result, 'UTF-8', ["UTF-8", "UTF-16"]);
}else{
$result = mb_convert_encoding($result, "UTF-8", ["cp1252"]);
}
}else if($encode != 'UTF-8'){
$result = mb_convert_encoding($result, "UTF-8", $encode);
}
private $market_US = [
'ATVPDKIKX0DER',
'A1AM78C64UM0Y8',
'A2EUQ1WTGCTBG2',
'A21TJRUUN4KGV',
'A2Q3Y263D00KWC',
'A39IBJ37TRP1C6',
];
private $market_EU = [
'A1PA6795UKMFR9',
'A1RKKUPIHCS9HS',
'A13V1IB3VIYZZH',
];
private $market_JP = [
'A1VC38T7YXB528'
];
private $market_CN = [
'AAHKV2X7AFYLW'
];
```
```
<?php
namespace App\Service\Amazon;
class MarketplaceId {
# North America region
const BR = 'A2Q3Y263D00KWC'; # 巴西
const CA = 'A2EUQ1WTGCTBG2'; # 加拿大
const MX = 'A1AM78C64UM0Y8'; # 墨西哥
const US = 'ATVPDKIKX0DER'; # 美国
# Europe region
const AE = 'A2VIGQ35RCS4UG'; # 阿联酋
const DE = 'A1PA6795UKMFR9'; # 德国
const EG = 'ARBP9OOSHTCHU'; # 埃及
const ES = 'A1RKKUPIHCS9HS'; # 西班牙
const FR = 'A13V1IB3VIYZZH'; # 法国
const GB = 'A1F83G8C2ARO7P'; # 英国
const IN = 'A21TJRUUN4KGV'; # 印度
const IT = 'APJ6JRA9NG5V4'; # 意大利
const SA = 'A17E79C6D8DWNP'; # 沙特阿拉伯
const TR = 'A33AVAJ2PDY3EV'; # 土耳其
# Far East region
const SG = 'A19VAU5U5O7RUS'; # 新加坡
const AU = 'A39IBJ37TRP1C6'; # 澳大利亚
const JP = 'A1VC38T7YXB528'; # 日本
const CN = 'AAHKV2X7AFYLW'; # 中国
}
```
后续更新:
实际上出现了检测出编码为ISO-8859-1,最后转码还是乱码。该$result写入xls文件,双击打开日文显示正常。
后面发现,我改变该检测字符编码函数的第三个参数,结果却各不相同:
`$encode = mb_detect_encoding($result, array("UTF-8",'iso-8859-1',"Shift_JIS","cp1252",'UTF-16')); `
`$encode = mb_detect_encoding($result, array("UTF-8",'Shift_JIS',"iso-8859-1","cp1252",'UTF-16')); `
`$encode = mb_detect_encoding($result); `
同一个字符串三个返回结果都不一样。分别为:
ISO-8859-1
SJIS
false
这个检测编码的函数可能存在问题,需要后续深入研究。
但是,第二和第三的结果分别会构成
`$result = mb_convert_encoding($result, 'UTF-8', 'SJIS');`
和
`$result = mb_convert_encoding($result, 'UTF-8', 'Shift_JIS');`
逻辑。
都会正常转换成日文。
我的猜想是:
mb_convert_encoding并不是一个严格函数,在第三个参数【待检测的字符编码列表】给出的情况下,他会按顺序检测字符特性的符合度,达不到,按给出列表的顺序逐个匹配,达到一定符合度就直接返回匹配的编码,后续不再检测。
所以,在一个字符串的字符特性与多个编码的匹配度满足符合度的情况下,谁排在前面就return谁。所以出现了第一和第二的不同编码返回。
所以我这里建议是,如果已知目标字符串是哪国编码,指定转换即可,或者在mb_detect_encoding的检测列表将该国编码或者可能性按大小依次排列
对于你这个问题,既然已知日文,直接`mb_convert_encoding($result, 'UTF-8', 'Shift_JIS');`试试。
- 常见功能
- 第三方授权登录
- 邮件发送
- 简易聊天室
- 获取各国汇率
- PHP获取服务器硬件指标
- 数据上报之
- web开发
- 开发规范
- 前端
- 踩坑
- 将footer固定在底部
- bootstrap
- Metronic
- 用到的jquery插件
- bootstrap-hover-dropdown
- jquery.slimscroll
- jquery.blockui
- bootstrap-switch
- js.cookie
- moment
- bootstrap-daterangepicker
- morris
- raphael
- jquery.waypoints
- jquery.counterup
- select2
- 取值和设置默认值
- vue
- axios
- 浏览器
- 谷歌浏览器
- 谷歌插件
- layui
- layui-表格
- layui-表单
- layui-弹窗
- layui-分页
- 后端
- 操作系统
- linux
- 用户管理
- 文件管理
- 目录管理
- 压缩和解压缩
- 进程查看
- 端口查看
- 开机自启动服务
- 定时任务
- shell脚本
- 杀掉运行超过指定时长指定服务的进程
- 获取服务器使用状态
- bash-shell连接socket
- 自定义快捷命令
- centos-踩坑
- 防火墙
- 软件
- yum
- vim
- screen
- window
- 语言
- PHP
- 配置优化
- 框架
- thinkphp5.1+
- think命令行
- laravel6.+
- 维护模式
- 根据环境读取不同配置
- laravel6.+采坑
- laravel坑位
- 数据库事务
- 任务调度
- 文件权限问题
- 增强框架
- larvel:elastic-search
- 图形验证码
- laravel获取ip
- 函数
- strtotime
- 正则匹配
- 类
- 接口类与抽象类
- 类相关的关键字 - abstract
- 类相关的关键字 - interface
- PHP有关类的调用方式"->"与"::"的区别
- 扩展
- 问题归纳
- json_encode和json_decode
- 字符串的运算
- curl
- 优化php效率
- 数组相加合并与array_merge
- 时区转换
- 不常用特性
- php反射
- 包管理器-composer
- GuzzleHttp
- Python
- Go
- 数据库
- Redis
- 安装
- 本地化-数据备份
- php-redis操作
- Mysql
- mysql-命令集合
- 设置终端可访问
- 数据库设计
- 用户基础信息表
- 踩坑集合
- mysql-2002
- mysql-2054
- 优化策略
- mysql-密码验证插件
- 一些牛逼的sql查询
- topN
- 无限级分类
- Memcache
- MongoDb
- 安装mongo-server
- 安装php-mongodb扩展
- 在laravel中使用mongoDB
- 客户端软件
- Hbase
- Elasticsearch
- elastic-search
- restfulApi操作es
- web服务器
- 1.nginx
- 配置语法规则
- 配置详解
- rewrite规则
- request_filename
- 2.apache
- 功能设计
- 加密解密
- Base64
- 对亚马逊SKU加密
- 兼职项目中的加解密
- 腾讯外包时的加密
- 接口设计
- 接口限流设计
- 分库分表
- 遍历展示文件目录结构
- 时区换算
- 文件切割
- 解析xml字符串
- 项目
- 博客后台管理
- 亚马逊广告API
- 官方指引文档
- 开发人员中心
- 应用商店
- 第三方库
- 申请API邮件记录
- 亚马逊MWS
- 付款报告
- 乱码
- 亚马逊管理库存报告
- 报告
- 商品
- 入库
- 履行
- 出库
- 财务
- 订单
- 异步任务处理
- 集群如何同步代码
- 基本开发流程
- 文档管理
- showdoc
- 运行环境
- 开发环境
- vagrant
- windows上配置安装
- vagrant安装插件缓慢
- 更换ssh默认端口映射
- 设置x-shell密码登录
- 使用市场的box-homestead
- homestead-7: Box 'lc/homestead'
- 常见问题
- 虚拟环境reboot
- 突然无法使用
- phpStudy
- wamp
- 压测性能
- VPN
- vultr
- 凌空图床
- 宝塔
- 自动化部署
- 版本管理软件钩子
- 线上环境-LNMP
- centos7
- nginx
- mysql
- mysql开机自启
- mysql-更换默认端口
- datetime字段类型默认值
- php
- php扩展安装
- redis
- swoole
- gd
- BCMath
- igbinary
- zstd
- 包管理器:composer
- 优化性能
- nodejs
- 更新gcc版本
- 版本控制
- git
- 常用命令
- gitlab
- 版本管理规范
- 使用阿里云创建远程仓库
- git自动化部署
- svn
- 忽略指定文件
- 拉取代码
- 自动化运维
- jekins
- 容器
- 集群
- 架构设计
- 设计原则
- 阅读参考
- 代码规划
- 架构实战
- 服务治理
- 权限控制设计
- 具体设计
- 计划
- 疑问知识点
- 读书笔记
- 高性能Mysql
- TCP-IP详解-卷一:协议
- 思考
- php如何实现并发执行
- 对接调用设计
- 如何在浏览器上实现插件
- 如何设计一个app结合业务告警
- mysql的where查询没有用到索引
- 为啥in查询比循环嵌套sql的查询还要慢
- 使用git来创建属于自己的composer包
- 翻页获取数据的时候又新增了数据
- 安全思路
- 月报
- PHP ?? 和 ?: 的区别
- PHP异步执行
- redis集群的目标是什么
- 大文件数据处理
- 性能瓶颈分析
- 命令行里输出带颜色的字体
- 面试问题合集
- 基础
- 安全
- 算法
- 冒泡排序
- 快速排序
- 二分法查询数组指定成员
- 字符查找匹配
- 令牌桶
- 漏桶
- 计数器
- 代理
- 协议
- http
- 状态码
- tcp
- udp
- Oauth2.0
- 设计模式
- 单例模式
- 适配器模式
- 工厂模式
- 观察者模式
- 流程化
- 地址栏输入网址到返回网页的流程
- 题目收集
- 工具
- rabbitMq
- rabbitMQ用户管理
- 生产者
- 消费者
- 支持TP5.*的think-queue
- 消息丢失
- 消费者报错
- rabbitMQ配置优化
- 磁盘满载导致服务挂掉
- PHP类库
- rabbitMQ踩坑
- navicat
- vscode
- phpstorm
- 激活码
- markdown
- PHP自定义类库
- 工具类
- 领导力
- 任务分配
- 代码组织
- 不要重复
- 避免污染
- 接口定义规范
- 小业务需求
- 获取充值面额组成
- 监控服务器CPU和内存
- shell脚本版本